Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.nunique方法的使用。

DataFrame.nunique(self, axis=0, dropna=True) → pandas.core.series.Series    [source]

在请求的轴上计数不同的观察值。

返回Series不同的观测值(observations)。可以忽略NaN值

参数

axis : {0 or ‘index’, 1 or ‘columns’}, 默认为 0

要使用的轴。行为0'index',列为1'columns'

dropna bool, 默认为True

不要在计数中包括NaN

返回值

Series

例子

>>> df = pd.DataFrame({'A': [1, 2, 3], 'B': [1, 1, 1]})
>>> df.nunique()
A    3
B    1
dtype: int64

>>> df.nunique(axis=1)
0    1
1    2
2    2
dtype: int64