📜  pd.dataframe 初始列 - Python (1)

📅  最后修改于: 2023-12-03 15:03:32.717000             🧑  作者: Mango

pd.DataFrame 初始列 - Python

在 Pandas 中,可以使用 pd.DataFrame() 函数来创建一个 DataFrame。其中,可以使用 data 参数来传入初始数据。本文将介绍如何在传入数据时设置 DataFrame 的初始列。

直接传入字典

可以直接传入一个字典对象来设置 DataFrame 的初始列。字典的键将成为列索引,值则成为该列的初始数据。

import pandas as pd

data = {
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35],
    'gender': ['F', 'M', 'M'],
}

df = pd.DataFrame(data)
print(df)

输出结果:

       name  age gender
0     Alice   25      F
1       Bob   30      M
2   Charlie   35      M
使用 numpy.ndarray

使用 numpy.ndarray 对象来创建 DataFrame 时,可以传入一个二维数组作为初始数据,同时使用 columns 参数来设置列名。

import numpy as np
import pandas as pd

data = np.array([
    ['Alice', 25, 'F'],
    ['Bob', 30, 'M'],
    ['Charlie', 35, 'M'],
])

df = pd.DataFrame(data, columns=['name', 'age', 'gender'])
print(df)

输出结果与上一种方式相同:

       name age gender
0     Alice  25      F
1       Bob  30      M
2   Charlie  35      M
使用 list of dict

可以使用一个由多个字典组成的列表来创建 DataFrame。字典的键将成为列索引,每个字典的值将构成该列的数据。我们也可以使用 columns 参数来设置列名。

import pandas as pd

data = [
    {'name': 'Alice', 'age': 25, 'gender': 'F'},
    {'name': 'Bob', 'age': 30, 'gender': 'M'},
    {'name': 'Charlie', 'age': 35, 'gender': 'M'},
]

df = pd.DataFrame(data, columns=['name', 'age', 'gender'])
print(df)

输出结果与之前相同:

       name  age gender
0     Alice   25      F
1       Bob   30      M
2   Charlie   35      M

以上三种方式均可以在传入数据时设置 DataFrame 的初始列。根据实际问题的不同,不同的方式可能更适合某些情况。