📅  最后修改于: 2023-12-03 15:03:30.127000             🧑  作者: Mango
Pandas是Python语言的开源数据分析库。其最主要的数据结构是Series和DataFrame,我们在本文中将着重介绍DataFrame数组。
DataFrame是一种二维的数据结构,类似于电子表格或SQL表格。数据对齐是自动的,同时支持列名(列标题)和行标签(行名称)。
我们可以使用Pandas的DataFrame()
函数来创建DataFrame数组。
import pandas as pd
data = {'name': ['John', 'Bob', 'Alice', 'Mary'],
'age': [23, 54, 10, 32],
'country': ['USA', 'Canada', 'England', 'Australia']}
df = pd.DataFrame(data)
print(df)
输出:
name age country
0 John 23 USA
1 Bob 54 Canada
2 Alice 10 England
3 Mary 32 Australia
我们可以使用以下的方式来选择和过滤DataFrame数组中的数据:
# 选择某一列
df['name']
# 选择某几列
df[['name', 'age']]
# 筛选年龄大于30岁的行
df[df['age'] > 30]
我们可以使用以下的方式来修改DataFrame数组中的数据:
# 修改某一行某一列的数据
df.at[2, 'name'] = 'Chris'
# 添加一行数据
new_data = {'name': 'David', 'age': 28, 'country': 'USA'}
df = df.append(new_data, ignore_index=True)
# 删除某一行数据
df = df.drop(1)
Pandas的DataFrame数组为我们提供了方便的二维数据结构,能够进行快速的数据处理和分析。拥有丰富的数据选择、过滤、修改等功能,非常适合进行大规模数据处理。