📜  使用 Pandas 操作数据帧 – Python(1)

📅  最后修改于: 2023-12-03 14:49:44.609000             🧑  作者: Mango

使用 Pandas 操作数据帧 – Python

Pandas 是一个用于数据处理和数据分析的 Python 库。它能够处理各种数据源,包括 CSV 文件、Microsoft Excel 文件、SQL 数据库、JSON 格式等等。本文将介绍如何使用 Pandas 操作数据帧。

安装 Pandas

使用 pip 命令安装 Pandas:

pip install pandas
导入 Pandas

在使用 Pandas 之前,需要先导入它:

import pandas as pd
创建数据帧

可以使用 Pandas 创建数据帧,下面是两种方法。

从列表创建数据帧
data = {'名字': ['Tom', 'Jerry', 'Mike', 'Rose'],
        '年龄': [20, 28, 30, 25],
        '城市': ['北京', '上海', '广州', '深圳']}
df = pd.DataFrame(data)
print(df)

输出结果:

| | 名字 | 年龄 | 城市 | | --- | ------ | ---- | ---- | | 0 | Tom | 20 | 北京 | | 1 | Jerry | 28 | 上海 | | 2 | Mike | 30 | 广州 | | 3 | Rose | 25 | 深圳 |

从 CSV 文件创建数据帧
df = pd.read_csv('file.csv')
查看数据帧

使用以下方法可以查看数据帧的前几行:

df.head()

使用以下方法可以查看数据帧的后几行:

df.tail()

使用以下方法可以查看数据帧的行列数:

df.shape
选择数据

可以通过以下方法选择数据:

选择一列数据
df['名字']
选择多列数据
df[['名字', '年龄']]
选择一行数据
df.loc[0]
选择多行数据
df.loc[[0, 1]]
选择满足特定条件的数据
df[df['城市'] == '北京']
修改和删除数据
修改一列数据
df['年龄'] = df['年龄'] + 2
删除一列数据
df = df.drop('年龄', 1)
修改一行数据
df.loc[1] = ['Jerry', 30, '上海']
删除一行数据
df = df.drop(1)
数据操作
排序

可以使用以下方法对数据进行排序:

df = df.sort_values(by='年龄')
分组

可以使用以下方法对数据进行分组:

groups = df.groupby('城市')
for group in groups:
    print(group[0])
    print(group[1])
合并

可以使用以下方法将两个数据帧合并:

df1 = pd.DataFrame({'id': [1, 2, 3], 'value': ['A', 'B', 'C']})
df2 = pd.DataFrame({'id': [4, 5, 6], 'value': ['D', 'E', 'F']})
df = pd.concat([df1, df2], ignore_index=True)
小结

Pandas 是一个功能强大的数据处理和分析库,可以处理各种数据源。本文介绍了如何使用 Pandas 创建、查看、选择、修改和删除数据,以及如何对数据进行操作。