Python Pandas 是一个高效强大的数据分析工具,提供了灵活的一维(Series)和二维(DataFrame)数据结构,支持数据读取、清洗、筛选、聚合、时间序列处理等功能,是进行数据分析和机器学习预处理的基础利器。本文主要介绍Python Pandas 入门教程。

1、安装Pandas

如果已经在系统上安装了Python和PIP,则Pandas的安装非常简单。

使用以下命令安装它:

pip install pandas

如果该命令执行失败,建议使用已预装 Pandas 的 Python 发行版,如 Anaconda 或集成开发环境如 Spyder 等。

2、Import Pandas

安装 Pandas 后,可使用 import 语句将其引入到程序中:

import pandas

Pandas导入后,可以使用了。

例如:

import pandas

mydataset = {
'langs': ["C", "Python", "Java"],
'count': [3, 7, 2]
}

myvar = pandas.DataFrame(mydataset)

print(myvar)

3、Pandas as pd

Pandas通常以pd别名导入。

alias(别名):在 Python 中,别名是对某个对象或模块赋予的另一个名称,用于简化引用或提高代码可读性。

导入时,使用as关键字创建别名:

import pandas as pd

执行后,Pandas软件包可以称为pd而不是pandas

例如:

import pandas as pd

mydataset = {
'langs': ["C", "Python", "Java"],
'count': [3, 7, 2]
}

myvar = pd.DataFrame(mydataset)

print(myvar)

4、判断Pandas版本

Pandas版本字符串存储在__version__属性下。

例如:

import pandas as pd

print(pd.__version__)

相关文档:

Python pandas DataFrame 行列使用常用操作

Python pandas DataFrame 行列的常用操作及运算

推荐文档