Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.explode方法的使用。

DataFrame.explode(self, column: Union[str, Tuple])  [源代码]

将类似列表的每个元素转换为一行,从而复制索引值。

0.25.0版中的新功能。

参数

column : str或tuple

返回值

DataFrame

将列表分解为子列的行;将为这些行复制索引。

Raises

ValueError

如果框架的列不是唯一的。

Notes

此例程将爆炸类似列表的事件,包括列表,元组,系列和np.ndarray。子集行的结果dtype将为object。标量将保持不变。空的类似列表将导致该行的np.nan。

例子

>>> df = pd.DataFrame({'A': [[1, 2, 3], 'foo', [], [3, 4]], 'B': 1})
>>> df
A B
0 [1, 2, 3] 1
1 foo 1
2 [] 1
3 [3, 4] 1
>>> df.explode('A')
A B
0 1 1
0 2 1
0 3 1
1 foo 1
2 NaN 1
3 3 1
3 4 1