Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.hist方法的使用。

DataFrame.hist(data, column=None, by=None, grid=True, xlabelsize=None, xrot=None, ylabelsize=None, yrot=None, ax=None, sharex=False, sharey=False, figsize=None, layout=None, bins=10, **kwds)                [source]

制作DataFrame的直方图。

A直方图是数据的分布的表示。此函数matplotlib.pyplot.hist()DataFrame中的每个series上调用,从而导致每列一个直方图。

参数:

data : DataFrame

存放数据的pandas对象。

column :string sequence

如果通过,将用于将数据限制为列的子集。

by : 对象(object),可选

如果通过,则用于形成单独组的直方图。

grid : bool,默认为True

是否显示轴线网格线。

xlabelsize : int,默认值 None

如果指定,则更改x轴标签的大小。

xrot : float,默认 None

x轴标签的旋转。例如,

值为90将显示x标签顺时针旋转90度。

ylabelsize : int,默认值 None

如果指定,则更改y轴标签大小。

yrot : float,默认为 None

y轴标签的旋转。例如,

值90显示y标签顺时针旋转90度。

ax : Matplotlib轴对象,默认为 None

绘制直方图的轴。

sharex : bool,如果axNone

默认为True,否则False

如果subplots = True

则共享x轴并将一些x轴标签设置为不可见;

如果ax为None,则默认为True;否则,

如果ax为传入,则为False。请注意,

同时传递ax和sharex = True

将更改图形中所有子图的所有x轴标签。

sharey : bool,默认为False

如果subplots = True

则共享y轴并将一些y轴标签设置为不可见。

figsize : 元组(tuple)

要创建的图形的尺寸(以英寸为单位)。

默认情况下使用 matplotlib.rcParams中的值。

layout : 元组(tuple),可选

(行(rows),列(columns))

元组用于直方图的布局。

bins : integersequence

默认为10

要使用的直方图箱数。如果给定整数,

则将计算bins + 1 bins边缘并返回。

如果bin是序列,则给出bin边缘,

包括第一个bin的左边缘和

最后一个bin的右边缘。

在这种情况下,

bins将被原封不动地返回。

** kwds

其他所有要传递给的绘图关键字参数 

matplotlib.pyplot.hist()

返回值

其中的matplotlib.AxesSubplotnumpy.ndarray

例子

本示例根据一些动物的长度和宽度绘制直方图,显示在三个箱中

>>> df = pd.DataFrame({
...     'length': [1.5, 0.5, 1.2, 0.9, 3],
...     'width': [0.7, 0.2, 0.15, 0.2, 1.1]
...     }, index= ['pig', 'rabbit', 'duck', 'chicken', 'horse'])
>>> hist = df.hist(bins=3)

pandasDataFramehist