📅  最后修改于: 2023-12-03 15:21:56.860000             🧑  作者: Mango
Pandas 是 Python 编程语言的一个重要数据分析包,主要用于数据处理和处理。Pandas 的 DataFrame对象是一个类似于二维表格的数据结构。本文将介绍如何使用字典列表创建 Pandas DataFrame。
在使用 Pandas 创建 DataFrame 之前,需要先导入 Pandas 模块。一般情况下我们可以使用以下方式导入 Pandas 模块:
import pandas as pd
创建 DataFrame 的方法之一是使用字典列表。在这种情况下,每个字典都表示一个数据记录,每个字典的键表示列名(即数据记录的属性),每个键所对应的值表示一个数据记录的值。例如,我们可以使用以下字典列表创建一个 DataFrame:
# 导入 pandas 模块
import pandas as pd
# 创建一个字典列表
data = [
{'name': 'alice', 'age': 22},
{'name': 'bob', 'age': 25},
{'name': 'charlie', 'age': 30},
{'name': 'david', 'age': 35},
{'name': 'eve', 'age': 40}
]
# 使用字典列表创建 DataFrame
df = pd.DataFrame(data)
# 输出 DataFrame
print(df)
输出结果如下:
name age
0 alice 22
1 bob 25
2 charlie 30
3 david 35
4 eve 40
在上面的代码中,我们创建了一个字典列表,其中每个字典表示一条数据记录。我们使用了 Pandas 的 DataFrame 函数来创建 DataFrame。在创建 DataFrame 时,我们不必显式指定列名及其顺序,Pandas 会自动生成一个默认的整数索引列。
我们还可以通过指定列名的顺序来创建 DataFrame。例如,我们可以使用以下代码创建一个不同顺序的 DataFrame:
# 导入 pandas 模块
import pandas as pd
# 创建一个字典列表
data = [
{'age': 22, 'name': 'alice'},
{'age': 25, 'name': 'bob'},
{'age': 30, 'name': 'charlie'},
{'age': 35, 'name': 'david'},
{'age': 40, 'name': 'eve'}
]
# 指定列名的顺序
cols = ['name', 'age']
# 使用字典列表和列名列表创建 DataFrame
df = pd.DataFrame(data, columns=cols)
# 输出 DataFrame
print(df)
输出结果如下:
name age
0 alice 22
1 bob 25
2 charlie 30
3 david 35
4 eve 40
在上面的代码中,我们指定了列名的顺序,再使用 DataFrame 函数创建 DataFrame 时,就按照指定的列名顺序来排列了。
在创建 DataFrame 时,如果某条数据记录中没有某个属性,Pandas 会使用 NaN 值来填充。例如,我们可以使用以下字典列表创建一个 DataFrame:
# 导入 pandas 模块
import pandas as pd
# 创建一个字典列表
data = [
{'name': 'alice', 'age': 22, 'gender': 'female'},
{'name': 'bob', 'age': 25},
{'name': 'charlie', 'gender': 'male'},
{'age': 35, 'name': 'david'},
{'name': 'eve'}
]
# 使用字典列表创建 DataFrame
df = pd.DataFrame(data)
# 输出 DataFrame
print(df)
输出结果如下:
name age gender
0 alice 22.0 female
1 bob 25.0 NaN
2 charlie NaN male
3 david 35.0 NaN
4 eve NaN NaN
在上面的代码中,我们创建了一个字典列表,其中包含不同数量和顺序的数据记录。在创建 DataFrame 时,Pandas 会按照所有数据记录所具备的属性创建列,如果某些数据记录缺少某个属性,Pandas 会使用 NaN 值来填充。
在本文中,我们介绍了如何使用字典列表创建 Pandas DataFrame。我们首先使用了一个简单的字典列表来创建 DataFrame,然后介绍了如何指定列名和顺序,最后演示了如何处理缺失值。Pandas DataFrame 是非常强大和灵活的数据结构,在数据处理和分析过程中广泛使用。