📅  最后修改于: 2023-12-03 15:09:34.413000             🧑  作者: Mango
在数据分析中,我们经常需要向 Pandas 数据框中添加具有常量值的列,比如数据记录的时间戳或实验相关的标签。本文将介绍如何在 Pandas 数据框中添加具有常量值的列,供程序员参考和使用。
首先,让我们创建一个简单的 Pandas 数据框:
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Age': [25, 32, 18, 47]}
df = pd.DataFrame(data)
print(df)
输出结果如下:
Name Age
0 Alice 25
1 Bob 32
2 Charlie 18
3 David 47
最简单的方法是将常量值作为列表添加到 Pandas 数据框。例如,我们将时间戳 '2022-01-01' 添加为一个新列:
df['Timestamp'] = ['2022-01-01', '2022-01-01', '2022-01-01', '2022-01-01']
print(df)
输出结果如下:
Name Age Timestamp
0 Alice 25 2022-01-01
1 Bob 32 2022-01-01
2 Charlie 18 2022-01-01
3 David 47 2022-01-01
另一种方式是将常量值作为元组添加到 Pandas 数据框。例如,我们将一个元组 ('Experiment A', 'Group 1') 添加为一个新列:
df['Experiment'] = [('Experiment A', 'Group 1'), ('Experiment A', 'Group 2'),
('Experiment B', 'Group 1'), ('Experiment B', 'Group 2')]
print(df)
输出结果如下:
Name Age Timestamp Experiment
0 Alice 25 2022-01-01 (Experiment A, Group 1)
1 Bob 32 2022-01-01 (Experiment A, Group 2)
2 Charlie 18 2022-01-01 (Experiment B, Group 1)
3 David 47 2022-01-01 (Experiment B, Group 2)
还有一种流行的方式是使用 Numpy 数组来添加常量值。例如,我们将一个长度为 4 的全 1 数组添加为一个新列:
import numpy as np
df['Ones'] = np.ones(4)
print(df)
输出结果如下:
Name Age Timestamp Experiment Ones
0 Alice 25 2022-01-01 (Experiment A, Group 1) 1.0
1 Bob 32 2022-01-01 (Experiment A, Group 2) 1.0
2 Charlie 18 2022-01-01 (Experiment B, Group 1) 1.0
3 David 47 2022-01-01 (Experiment B, Group 2) 1.0
以上是在 Pandas 数据框中添加具有常量值的列的三种常见方法,包括将常量值作为列表、元组和 Numpy 数组。这些方法都是快捷、简单的,适用于数据编程和数据分析。