Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.from_dict方法的使用。

classmethod DataFrame.from_dict(data, orient='columns', dtype=None, columns=None)                                  [源代码]

从类似数组或字典的字典构造DataFrame。

通过按列或允许dtype规范的索引从字典创建DataFrame对象。

参数

data : dict

格式为{field:array-like}{field:dict}

Orient : {'columns','index'},默认为'columns'

数据的 “orientation” 

如果传递的dict的键应为结果DataFrame的列,

请传递“ columns”(默认值)。

否则,如果键应该是行,则传递“ index”

dtype : dtype,默认为None

强制的数据类型,否则推断。

columns : list,默认None

时使用的列标签orient='index'

如果与一起使用,则会引发ValueError orient='columns'

0.23.0版中的新功能。

返回值

DataFrame

例子

默认情况下,字典的键成为DataFrame列

>>> data = {'col_1': [3, 2, 1, 0], 'col_2': ['a', 'b', 'c', 'd']}
>>> pd.DataFrame.from_dict(data)
col_1 col_2
0 3 a
1 2 b
2 1 c
3 0 d

指定orient='index'使用字典键作为行来创建DataFrame

>>> data = {'row_1': [3, 2, 1, 0], 'row_2': ['a', 'b', 'c', 'd']}
>>> pd.DataFrame.from_dict(data, orient='index')
0 1 2 3
row_1 3 2 1 0
row_2 a b c d

使用‘index’方向时,可以手动指定列名称

>>> pd.DataFrame.from_dict(data, orient='index',
... columns=['A', 'B', 'C', 'D'])
A B C D
row_1 3 2 1 0
row_2 a b c d