Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.pipe方法的使用。

DataFrame.pipe(self, func, *args, **kwargs)     [source]

适用func(self, *args, **kwargs)

参数

func :function

函数可应用于Series/DataFrame

argskwargs被传递到func。

或者是一个(callable,data_keyword)元组,

其中data_keyword是一个字符串,

表示可调用的关键字,

该关键字需要Series/DataFrame

args :iterable(可迭代),可选

位置参数传递给func

kwargs mapping, 可选

关键字参数字典传入func



返回值

object :返回类型func

Notes

.pipe在将需要Series,DataFrames或GroupBy对象的函数链接在一起时使用。而不是写:

>>> f(g(h(df), arg1=a), arg2=b, arg3=c)

你可以写,

>>> (df.pipe(h)
...    .pipe(g, arg1=a)
...    .pipe(f, arg2=b, arg3=c)
... )

如果您有一个将数据作为(例如)第二个参数的函数,则传递一个元组,指示哪个关键字需要该数据。例如,假设f将其数据作为arg2:

>>> (df.pipe(h)
...    .pipe(g, arg1=a)
...    .pipe((f, 'arg2'), arg1=a, arg3=c)
...  )