Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.first方法的使用。

DataFrame.first(self, offset)

一种基于日期偏移量来设置时间序列数据的初始时段的便捷方法。

参数

offset :string,DateOffset,dateutil.relativedelta

返回值

subset : 与调用者相同的类型

Raises

TypeError

如果索引不是 DatetimeIndex

例子

>>> i = pd.date_range('2018-04-09', periods=4, freq='2D')
>>> ts = pd.DataFrame({'A': [1,2,3,4]}, index=i)
>>> ts
A
2018-04-09 1
2018-04-11 2
2018-04-13 3
2018-04-15 4

获取前3天的行:

>>> ts.first('3D')
A
2018-04-09 1
2018-04-11 2

注意:返回的是第3个日历日的数据,而不是数据集中观察到的前3天的数据,因此没有返回2018-04-13的数据。