📅  最后修改于: 2023-12-03 15:40:49.088000             🧑  作者: Mango
熊猫数据框是一款用于数据分析和处理的Python包,提供了快速、灵活、可扩展的数据结构和数据分析工具。它的主要数据结构是DataFrame和Series,可以用于处理各种类型的数据(如数字、字符串、时间序列等)。
熊猫数据框具有许多优点,包括:
下面是一些常用的示例代码:
import pandas as pd
df = pd.read_csv('data.csv')
# 查看前5行
df.head()
# 查看后5行
df.tail()
# 查看数据行列数
df.shape
# 查看数据信息
df.info()
# 查看数据描述性统计信息
df.describe()
# 删除重复值
df.drop_duplicates()
# 删除缺失值
df.dropna()
# 替换缺失值
df.fillna(0)
# 修改列名
df.rename(columns={'old_name': 'new_name'})
# 修改列数据类型
df['column_name'] = df['column_name'].astype('new_type')
# 数据切片
df.loc[row_indexer, column_indexer]
# 数据过滤
df[df['column_name']>10]
# 数据分组
df.groupby('column_name').mean()
# 数据排序
df.sort_values(['column_name1', 'column_name2'], ascending=[True, False])
# 数据合并
pd.merge(df1, df2, how='inner', on='column_name')
以上只是熊猫数据框的一些基础用法,如果想要更深入地了解该库的用法,可以查看官方文档,或寻找相关教程。