📅  最后修改于: 2023-12-03 15:03:32.717000             🧑  作者: Mango
在 Pandas 中,可以使用 pd.DataFrame()
函数来创建一个 DataFrame。其中,可以使用 data
参数来传入初始数据。本文将介绍如何在传入数据时设置 DataFrame 的初始列。
可以直接传入一个字典对象来设置 DataFrame 的初始列。字典的键将成为列索引,值则成为该列的初始数据。
import pandas as pd
data = {
'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'gender': ['F', 'M', 'M'],
}
df = pd.DataFrame(data)
print(df)
输出结果:
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
使用 numpy.ndarray
对象来创建 DataFrame 时,可以传入一个二维数组作为初始数据,同时使用 columns
参数来设置列名。
import numpy as np
import pandas as pd
data = np.array([
['Alice', 25, 'F'],
['Bob', 30, 'M'],
['Charlie', 35, 'M'],
])
df = pd.DataFrame(data, columns=['name', 'age', 'gender'])
print(df)
输出结果与上一种方式相同:
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
可以使用一个由多个字典组成的列表来创建 DataFrame。字典的键将成为列索引,每个字典的值将构成该列的数据。我们也可以使用 columns
参数来设置列名。
import pandas as pd
data = [
{'name': 'Alice', 'age': 25, 'gender': 'F'},
{'name': 'Bob', 'age': 30, 'gender': 'M'},
{'name': 'Charlie', 'age': 35, 'gender': 'M'},
]
df = pd.DataFrame(data, columns=['name', 'age', 'gender'])
print(df)
输出结果与之前相同:
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
以上三种方式均可以在传入数据时设置 DataFrame 的初始列。根据实际问题的不同,不同的方式可能更适合某些情况。