Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一,本文主要介绍Python Pandas Series。

1、什么是Series?

Pandas Series就像表格中的一列。

它是一维数组,可保存任何类型的数据。

例如:

从列表中创建一个简单的Pandas Series:

import pandas as pd

a = [1, 7, 2]

myvar = pd.Series(a)

print(myvar)

2、标签(Labels)

如果未指定其他任何内容,则这些值将用其索引号标记。 第一个值的索引为0,第二个值的索引为1,依此类推。

该标签可用于访问指定值。

例如:

返回Series的第一个值:

print(myvar[0])

3、创建

标签(Labels)

使用index参数,可以命名自己的标签。

例如:

创建自己的标签:

import pandas as pd

a = [1, 7, 2]

myvar = pd.Series(a, index = ["x", "y", "z"])

print(myvar)

创建标签后,可以通过参考标签来访问项目。

例如:

返回值“y”:

print(myvar["y"])

4、Key/Value Objects as Series

创建Series时,还可以使用键/值对象,例如,字典。

例如:

从字典创建一个简单的Pandas Series:

import pandas as pd

calories = {"day1": 420, "day2": 380, "day3": 390}

myvar = pd.Series(calories)

print(myvar)

注意:字典的键将成为标签。

要仅选择词典中的某些项目,请使用index参数,并仅指定要包括在Series中的项目。

例如:

仅使用“day1”和“day2”中的数据创建Series:

import pandas as pd

calories = {"day1": 420, "day2": 380, "day3": 390}

myvar = pd.Series(calories, index = ["day1", "day2"])

print(myvar)

5、DataFrames

Pandas中的数据集通常是多维表,称为DataFrames。

Series就像一列,DataFrame是整个表。

例如:

从两个Series创建一个DataFrame:

import pandas as pd

data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}

myvar = pd.DataFrame(data)

print(myvar)

将在下一个文档中学习有关DataFrames的知识。












推荐文档