Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.median方法的使用。

DataFrame.median(self, axis=None, skipna=None, level=None, numeric_only=None, **kwargs)  [source]

返回所请求axi的值的中位数。

参数:       

axis{index (0), columns (1)}

要应用的功能的轴。

skipnabool,默认为True

计算结果时排除NA/null值。

levelint或级别名称,

默认为None

如果轴是MultiIndex(分层),

则沿特定级别计数,并折叠为Series

numeric_onlybool

默认值None

仅包括floatintboolean列。

如果为None,将尝试使用所有内容,

然后仅使用数字数据。未针对Series实施。

**kwargs

要传递给函数的其他关键字参数。

返回

Series 或 DataFrame(如果指定level)

例子

import pandas as pd
import numpy as np
raw_data = {'name': ['Willard Morris', 'Al Jennings', 'Omar Mullins', 'Spencer McDaniel'],
'age': [20, 19, 22, 21],
'favorite_color': ['blue', 'blue', 'yellow', "green"],
'grade': [88, 92, 95, 70]}
df = pd.DataFrame(raw_data, index = ['Willard Morris', 'Al Jennings', 'Omar Mullins', 'Spencer McDaniel'])
df['grade'].median()

输出结果:

90.0