Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.clip_lower方法的使用。

DataFrame.clip_lower(threshold, axis=None, inplace=False)

修剪低于给定阈值的值。

从版本0.24.0开始不推荐使用:改为使用clip(lower = threshold)。

阈值以下的元素将更改为与阈值匹配 。阈值可以是单个值或数组,在后一种情况下,它执行截断元素。

参数

threshold : 数字或类似数组

允许的最小值。低于阈值的所有值都将设置为此值。

float:将每个值与阈值进行比较。

array-like:阈值的形状应与它所比较的​​对象相匹配。

当self是一个系列时,阈值应该是长度。当自我是一个数据帧,

阈值应在2-d和相同的形状,自对axis=None,

或1-d和相同的长度轴线被比较。

axis : {0或'index',1或'columns'},默认为0

使自我与给定轴上的阈值对齐。

inplace : 布尔值,默认为False

是否对数据执行操作。

版本0.21.0中的新功能。

返回

Series或DataFrame

修剪了值的原始数据。

例子

Series单阈值限幅:

>>> s = pd.Series([5, 6, 7, 8, 9])
>>> s.clip(lower=8)
0 8
1 8
2 8
3 8
4 9
dtype: int64

Series剪辑元素使用阈值数组。阈值 应与Series的长度相同。

>>> elemwise_thresholds = [4, 8, 7, 2, 5]
>>> s.clip(lower=elemwise_thresholds)
0 5
1 8
2 7
3 8
4 9
dtype: int64

可以将DataFrame与标量进行比较。

>>> df = pd.DataFrame({"A": [1, 3, 5], "B": [2, 4, 6]})
>>> df
A B
0 1 2
1 3 4
2 5 6
>>> df.clip(lower=3)
A B
0 3 3
1 3 4
2 5 6

或者是一组值。默认情况下,阈值应与DataFrame的形状相同。

>>> df.clip(lower=np.array([[3, 4], [2, 2], [6, 2]]))
A B
0 3 4
1 3 4
2 6 6

控制如何使用轴广播阈值。在这种情况下, 阈值应与轴指定的轴长度相同 。

>>> df.clip(lower=[3, 3, 5], axis='index')
A B
0 3 3
1 3 4
2 5 6
>>> df.clip(lower=[4, 5], axis='columns')
A B
0 4 5
1 4 5
2 5 6

相关文档Python pandas.DataFrame.clip函数方法的使用