📅  最后修改于: 2023-12-03 15:26:34.870000             🧑  作者: Mango
pandas 是 Python 中的一个开源数据分析和数据处理库。pandas 中有一个很常用的数据结构叫做 DataFrame,它类似于其他语言中的表格或者电子表格。在 DataFrame 中,每一列数据可以是不同的类型(str、int、float 等),并且可以进行各种复杂的操作。
在 pandas 中,可以通过从一个 dict 创建 DataFrame 来实现数据的处理和分析。下面我们来一步步介绍如何使用来自组 pandas 的 dict。
我们可以通过直接创建一个字典来创建 DataFrame。例如:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 30, 35, 40]}
df = pd.DataFrame(data)
print(df)
输出结果为:
name age
0 Alice 25
1 Bob 30
2 Charlie 35
3 David 40
在这个字典中,'name' 和 'age' 是数据列的名称。可以发现,pandas 已经自动按照列名和行号进行了格式化。
如果我们想要进一步设置行名,可以在生成 DataFrame 时设置 'index' 参数:
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 30, 35, 40]}
df = pd.DataFrame(data, index=['A', 'B', 'C', 'D'])
print(df)
输出结果为:
name age
A Alice 25
B Bob 30
C Charlie 35
D David 40
在这个 DataFrame 中,我们为其添加了行索引,它们分别为 A、B、C 和 D,而不再是默认的数字索引。
访问 DataFrame 中的数据可以使用类似于字典查询的方式,例如:
print(df['name'])
输出结果为:
A Alice
B Bob
C Charlie
D David
Name: name, dtype: object
如果我们希望访问多列数据,则可以使用多个列名构成的列表,例如:
print(df[['name', 'age']])
输出结果为:
name age
A Alice 25
B Bob 30
C Charlie 35
D David 40
除了上述操作之外,pandas 还提供了丰富的数据操作和分析的功能,例如数据类型转换、数据合并、数据过滤等等。这些功能的使用方法可以参考 pandas 文档。
通过使用来自组 pandas 的 dict,我们可以方便地创建、访问和处理 DataFrame 数据,从而完成各种数据分析和处理任务。