Skip to main content

Python Pandas 包使用教程

Pandas 是一个 Python 数据分析库,提供了许多高效的数据结构和数据分析工具。它主要用于处理和分析结构化数据,如表格数据、CSV 文件等。

本教程将介绍 Pandas 的一些基本概念和常用操作,帮助您开始使用 Pandas。

安装 Pandas

在使用 Pandas 之前,您需要先安装它。您可以使用 pip 命令来安装 Pandas,如下所示:

pip install pandas

导入 Pandas

在使用 Pandas 之前,您需要先导入它。您可以使用以下命令导入 Pandas:

import pandas as pd

Pandas 的数据结构

Pandas 主要有两种数据结构:Series 和 DataFrame。

Series

Series 是一种类似于一维数组的数据结构,它可以存储整数、浮点数、字符串等类型的数据。每个 Series 对象都有一个索引,它可以用来访问数据。

以下是创建 Series 的示例:

import pandas as pd

data = pd.Series([0.25, 0.5, 0.75, 1.0])
print(data)

输出结果:

0 0.25
1 0.50
2 0.75
3 1.00
dtype: float64

DataFrame

DataFrame 是一种二维表格数据结构,每个列可以是不同的数据类型(整数、浮点数、字符串等),它可以看作是一组 Series 对象的集合。DataFrame 有行索引和列索引,可以用来访问数据。

以下是创建 DataFrame 的示例:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
print(df)

输出结果:

       name  age gender

0 Alice 25 F
1 Bob 32 M
2 Charlie 18 M
3 David 47 M

读取和写入数据

Pandas 可以读取和写入各种格式的数据,包括 CSV、Excel、SQL 数据库等。

读取 CSV 文件

以下是读取 CSV 文件的示例:

import pandas as pd

df = pd.read_csv('data.csv')
print(df)

写入 CSV 文件

以下是将 DataFrame 写入 CSV 文件的示例:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
df.to_csv('data.csv', index=False)