📅  最后修改于: 2023-12-03 15:11:55.555000             🧑  作者: Mango
熊猫系列(pandas)是一个强大的数据分析、数据处理和数据可视化的 Python 库。
可以使用 pip 命令安装:
pip install pandas
以下是一些熊猫系列的基本用法:
import pandas as pd
df = pd.read_csv('data.csv')
# 查看前几行
df.head()
# 查看后几行
df.tail()
# 查看数据类型
df.dtypes
# 查看列名
df.columns
# 查看数据的形状
df.shape
# 选择一列
df['column_name']
# 选择多列
df[['column_name1', 'column_name2']]
# 根据下标选择行
df.iloc[0]
# 根据条件选择行
df[df['column_name'] == 'value']
df.set_index('column_name', inplace=True)
# 处理缺失数据
df.dropna()
# 处理重复数据
df.drop_duplicates()
# 替换值
df.replace('old_value', 'new_value')
# 修改数据类型
df['column_name'] = df['column_name'].astype('new_type')
# 按列分组并计算均值
df.groupby('column_name').mean()
# 按列分组并计算总和
df.groupby('column_name').sum()
# 柱形图
df.plot.bar()
# 折线图
df.plot.line()
# 散点图
df.plot.scatter()
熊猫系列是一个非常实用的 Python 库,可以大大提高数据分析和可视化的效率。以上是一些熊猫系列的基本用法,希望可以帮助大家更好地使用该库。