Bootstrap
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.from_records方法的使用。

DataFrame.from_records(data,index = None,exclude = None,columns = None,coerce_float = False,nrows = None )源代码

将数据转换为DataFrame

参数

data : ndarray(结构化dtype),元组列表,dictDataFrame

index : 字符串,字段列表,类似数组

用作索引的数组字段,交替使用的一组特定输入标签

exclude :  序列(sequence),默认None

要排除的列或字段

columns : 序列(sequence),默认None

要使用的列名称。如果传递的数据没有与之关联的名称,

则此参数提供列的名称。否则,此参数指示结果中列的顺序

(数据中未找到的任何名称将变为全NA列)

coerce_float : boolean,默认为False

尝试将非字符串,非数字对象(如decimal.Decimal)的值转换为浮点.

SQL结果集很有用

nrows : int,默认None

如果数据是迭代器(iterator),则读取的行数

返回

df : DataFrame

例子

import pandas as pd
from collections import namedtuple

Item = namedtuple('Item', 'state area')
items = []

with open('unis.txt') as f: 
    for line in f:
        l = line.rstrip('\n') 
        if l.endswith('[edit]'):
            state = l.rstrip('[edit]')
        else:            
            i = l.index(' (')
            area = l[:i]
            items.append(Item(state, area))

df = pd.DataFrame.from_records(items, columns=['State', 'Area'])
print df

相关文档Python Pandas 通过读取txt文件内容创建DataFrame