Python pandas.DataFrame.to_numpy函数方法的使用

Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.to_numpy方法的使用。

DataFrame.to_numpy(dtype=None, copy=False, na_value=<object object>) [source]

将数据格式转换为一个NumPy数组。

新版本为0.24.0。

默认情况下,返回数组的dtype将是DataFrame中所有类型的公共NumPy dtype。例如,如果dtypefloat16float32,那么结果dtype将是float32。这可能需要复制数据和强制值,这可能是消耗高的。

参数:

dtype strnumpy.dtype, 可选

传递给的dtype numpy.asarray()

copy :bool,默认为False

是否确保返回的值不是另一个数组上的视图。

需要注意的是copy=False不能保证to_numpy()是没有副本。

相反,copy=True即使不是绝对必要,

也请确保已制作副本。

na_valueAny, 可选

用于缺失值的值。默认值取决于D型和DataFramedtypes

1.1.0版中的新功能。

返回值:

numpy.ndarray

例子

>>> pd.DataFrame({"A": [1, 2], "B": [3, 4]}).to_numpy()
array([[1, 3],
       [2, 4]])

对于异构数据,必须使用最低的通用类型

>>> df = pd.DataFrame({"A": [1, 2], "B": [3.0, 4.5]})
>>> df.to_numpy()
array([[1. , 3. ],
       [2. , 4.5]])

对于数字和非数字类型的混合,输出数组将具有对象dtype

>>> df['C'] = pd.date_range('2000', periods=2)
>>> df.to_numpy()
array([[1, 3.0, Timestamp('2000-01-01 00:00:00')],
       [2, 4.5, Timestamp('2000-01-02 00:00:00')]], dtype=object)

文档pandas.DataFrame.to_numpy

推荐阅读
cjavapy编程之路首页