Bootstrap
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.Grouper方法的使用。

class pandas.Grouper ( key = None,level = None,freq = None,axis = 0,sort = False )  [source]

Grouper允许用户为目标对象指定groupby指令
此规范将通过key参数选择列,或者如果给出了levelaxis参数,则指定了目标对象的索引级别。
这些是本地设置,将覆盖“全局”设置,即传递给groupby本身的轴参数和level。

参数:

key:string,默认为None

groupby键,用于选择目标的分组列

level:名称/数字,默认为无

目标索引的级别

freq:string / frequency对象,默认为None

如果目标选择(通过key或level)是类似日期时间的对象,

则将按指定的频率进行分组。

有关可用频率的完整说明,请参见此处

axis : 轴的编号/名称,默认为0

sort:布尔值,默认为False

是否对生成的标签进行排序

额外的kwargs来控制类似时间的groupers(当``freq``通过时)

closed  : 区间的封闭结束; 'left' 还是 'right'

label : 用于标记的区间边界; 'left'还是'right'

convention:{'start','end','e','s'}

如果groupers是PeriodIndex

base, loffset

返回:

groupby指令的规范

例如,

语法糖 df.groupby('A')

>>> df.groupby(Grouper(key='A'))

在“日期”列上指定重新采样操作

>>> df.groupby(Grouper(key='date', freq='60s'))

在列轴上的level“日期”上指定重新采样操作,频率为60秒

>>> df.groupby(Grouper(level='date', freq='60s', axis=1))