📌  相关文章
📜  pandas 数据帧数组 - Python (1)

📅  最后修改于: 2023-12-03 15:03:30.127000             🧑  作者: Mango

Pandas数据帧数组 - Python

Pandas是Python语言的开源数据分析库。其最主要的数据结构是Series和DataFrame,我们在本文中将着重介绍DataFrame数组。

什么是DataFrame?

DataFrame是一种二维的数据结构,类似于电子表格或SQL表格。数据对齐是自动的,同时支持列名(列标题)和行标签(行名称)。

创建DataFrame数组

我们可以使用Pandas的DataFrame()函数来创建DataFrame数组。

import pandas as pd

data = {'name': ['John', 'Bob', 'Alice', 'Mary'],
        'age': [23, 54, 10, 32],
        'country': ['USA', 'Canada', 'England', 'Australia']}

df = pd.DataFrame(data)

print(df)

输出:

    name  age    country
0   John   23        USA
1    Bob   54     Canada
2  Alice   10    England
3   Mary   32  Australia
选择和过滤数据

我们可以使用以下的方式来选择和过滤DataFrame数组中的数据:

# 选择某一列
df['name']

# 选择某几列
df[['name', 'age']]

# 筛选年龄大于30岁的行
df[df['age'] > 30]
修改DataFrame数组

我们可以使用以下的方式来修改DataFrame数组中的数据:

# 修改某一行某一列的数据
df.at[2, 'name'] = 'Chris'

# 添加一行数据
new_data = {'name': 'David', 'age': 28, 'country': 'USA'}
df = df.append(new_data, ignore_index=True)

# 删除某一行数据
df = df.drop(1)
总结

Pandas的DataFrame数组为我们提供了方便的二维数据结构,能够进行快速的数据处理和分析。拥有丰富的数据选择、过滤、修改等功能,非常适合进行大规模数据处理。