Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.mean方法的使用。

DataFrame.mean(self, axis=None, skipna=None, level=None, numeric_only=None, **kwargs) [source]

返回所请求轴的值的平均值。

参数:       

axis{index (0), columns (1)}

要应用的功能的轴。

skipnabool,默认为True

计算结果时排除NA/null值。

levelint或级别名称,

默认为None

如果轴是MultiIndex(分层),

则沿特定级别计数,并折叠为Series

numeric_onlybool

默认值None

仅包括floatintboolean列。

如果为None,将尝试使用所有内容,

然后仅使用数字数据。未针对Series实施。

**kwargs

要传递给函数的其他关键字参数。

返回

SeriesDataFrame(如果指定level)

例子

import pandas as pd    
info= pd.DataFrame({ “A” :[ 8 , 2 , 7 , 12 , 6 ],
“B” :[ 26 , 19 , 7 , 5 , 9 ],
“C” :[ 10 , 11 , 15 , 4 , 3 ],
“d” :[ 16 , 24 , 14 , 22 , 1 ]})
#打印数据框
info
#如果 未指定 axis = 0 ,则默认情况下 方法 返回 均值
#索引轴
info.mean(axis = 0)

输出结果:

7.0
B 13.2
C 8.6
D 15.4
dtype:float64
import pandas as pd 
#创建DataFrame
info = pd.DataFrame({"A":[5, 2, 6, 4, None],   
                   "B":[12, 19, None, 8, 21],   
                   "C":[15, 26, 11, None, 3],  
                   "D":[14, 17, 29, 16, 23]})   
# while finding mean, it skip null values   
info.mean(axis = 1,skipna = True)   

输出结果:

0 11.500000
1 16.000000
2 15.333333
3 9.333333
4 15.666667
dtype:float64