Python Pandas 包使用教程
Pandas 是一个 Python 数据分析库,提供了许多高效的数据结构和数据分析工具。它主要用于处理和分析结构化数据,如表格数据、CSV 文件等。
本教程将介绍 Pandas 的一些基本概念和常用操作,帮助您开始使用 Pandas。
安装 Pandas
在使用 Pandas 之前,您需要先安装它。您可以使用 pip 命令来安装 Pandas,如下所示:
pip install pandas
导入 Pandas
在使用 Pandas 之前,您需要先导入它。您可以使用以下命令导入 Pandas:
import pandas as pd
Pandas 的数据结构
Pandas 主要有两种数据结构:Series 和 DataFrame。
Series
Series 是一种类似于一维数组的数据结构,它可以存储整数、浮点数、字符串等类型的数据。每个 Series 对象都有一个索引,它可以用来访问数据。
以下是创建 Series 的示例:
import pandas as pd
data = pd.Series([0.25, 0.5, 0.75, 1.0])
print(data)
输出结果:
0 0.25
1 0.50
2 0.75
3 1.00
dtype: float64
DataFrame
DataFrame 是一种二维表格数据结构,每个列可以是不同的数据类型(整数、浮点数、字符串等),它可以看作是一组 Series 对象的集合。DataFrame 有行索引和列索引,可以用来访问数据。
以下是创建 DataFrame 的示例:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
print(df)
输出结果:
name age gender
0 Alice 25 F
1 Bob 32 M
2 Charlie 18 M
3 David 47 M
读取和写入数据
Pandas 可以读取和写入各种格式的数据,包括 CSV、Excel、SQL 数据库等。
读取 CSV 文件
以下是读取 CSV 文件的示例:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
写入 CSV 文件
以下是将 DataFrame 写入 CSV 文件的示例:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
df.to_csv('data.csv', index=False)