📅  最后修改于: 2023-12-03 14:49:44.609000             🧑  作者: Mango
Pandas 是一个用于数据处理和数据分析的 Python 库。它能够处理各种数据源,包括 CSV 文件、Microsoft Excel 文件、SQL 数据库、JSON 格式等等。本文将介绍如何使用 Pandas 操作数据帧。
使用 pip 命令安装 Pandas:
pip install pandas
在使用 Pandas 之前,需要先导入它:
import pandas as pd
可以使用 Pandas 创建数据帧,下面是两种方法。
data = {'名字': ['Tom', 'Jerry', 'Mike', 'Rose'],
'年龄': [20, 28, 30, 25],
'城市': ['北京', '上海', '广州', '深圳']}
df = pd.DataFrame(data)
print(df)
输出结果:
| | 名字 | 年龄 | 城市 | | --- | ------ | ---- | ---- | | 0 | Tom | 20 | 北京 | | 1 | Jerry | 28 | 上海 | | 2 | Mike | 30 | 广州 | | 3 | Rose | 25 | 深圳 |
df = pd.read_csv('file.csv')
使用以下方法可以查看数据帧的前几行:
df.head()
使用以下方法可以查看数据帧的后几行:
df.tail()
使用以下方法可以查看数据帧的行列数:
df.shape
可以通过以下方法选择数据:
df['名字']
df[['名字', '年龄']]
df.loc[0]
df.loc[[0, 1]]
df[df['城市'] == '北京']
df['年龄'] = df['年龄'] + 2
df = df.drop('年龄', 1)
df.loc[1] = ['Jerry', 30, '上海']
df = df.drop(1)
可以使用以下方法对数据进行排序:
df = df.sort_values(by='年龄')
可以使用以下方法对数据进行分组:
groups = df.groupby('城市')
for group in groups:
print(group[0])
print(group[1])
可以使用以下方法将两个数据帧合并:
df1 = pd.DataFrame({'id': [1, 2, 3], 'value': ['A', 'B', 'C']})
df2 = pd.DataFrame({'id': [4, 5, 6], 'value': ['D', 'E', 'F']})
df = pd.concat([df1, df2], ignore_index=True)
Pandas 是一个功能强大的数据处理和分析库,可以处理各种数据源。本文介绍了如何使用 Pandas 创建、查看、选择、修改和删除数据,以及如何对数据进行操作。