Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.expanding方法的使用。

DataFrame.expanding(self, min_periods=1, center=False, axis=0)

提供expanding转换

0.18.0版中的新功能。

参数

min_periods : int,默认1

窗口中具有值的最小观察数(否则结果为NA)。

center : bool,默认为False

将标签设置在窗口的中央。

axis : intstr,默认为0

返回值

为特定操作子类化的Window


Notes

默认情况下,结果设置为窗口的右边缘。可以通过设置将其更改为窗口的中心center=True。

例子

>>> df = pd.DataFrame({'B': [0, 1, 2, np.nan, 4]})
B
0 0.0
1 1.0
2 2.0
3 NaN
4 4.0
>>> df.expanding(2).sum()
B
0 NaN
1 1.0
2 3.0
3 3.0
4 7.0