📅  最后修改于: 2023-12-03 15:33:24.623000             🧑  作者: Mango
Pandas 是一个开源的数据分析工具包,具有数据清洗、架构化、统计分析等功能。它是 Python 语言中最受欢迎的库之一,被广泛应用于数据科学、机器学习等领域。Pandas 具有以下特点:
下面是一个 Pandas 库的例子:
import pandas as pd
# 创建一个简单的数据集
data = {
'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
'age': [25, 32, 18, 47, 22],
'gender': ['F', 'M', 'M', 'M', 'F'],
'country': ['US', 'UK', 'CA', 'AU', 'US']
}
df = pd.DataFrame(data)
# 显示数据框的前五行
print(df.head())
# 将年龄增加10岁,并显示修改后的结果
df['age'] = df['age'] + 10
print(df.head())
# 过滤出年龄大于30岁的人员,并显示结果
df_filtered = df[df['age'] > 30]
print(df_filtered)
# 将数据按国家和性别汇总,并显示结果
df_grouped = df.groupby(['country', 'gender']).size().reset_index(name='counts')
print(df_grouped)
以上代码演示了如何使用 Pandas 库来创建数据集、修改数据、过滤数据和汇总数据。Pandas 库具有易学、易用,适用于数据挖掘、机器学习、大数据等领域。