📅  最后修改于: 2023-12-03 15:33:24.298000             🧑  作者: Mango
在处理数据中,有时需要在现有数据的基础上加入新的列。使用 Pandas 库,可以很容易地实现此操作。下面介绍如何使用 Pandas 加入两列。
首先,我们需要创建一个示例数据集。可以使用 Pandas 的 DataFrame 对象创建数据集。
import pandas as pd
# 创建示例数据集
df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Age': [25, 32, 18, 47],
'Gender': ['F', 'M', 'M', 'M']})
print(df)
输出结果如下:
Name Age Gender
0 Alice 25 F
1 Bob 32 M
2 Charlie 18 M
3 David 47 M
接下来,我们将添加两列数据到现有数据集中。
首先,我们将添加一列名为 'Salary' 的新数据列,该列将包含员工的薪水信息。
在 Pandas 中,添加一列可以使用下面的语法:
df['New_Column_Name'] = values_list
其中,'New_Column_Name' 是新列的名称,values_list 是一个列表,包含要添加到该列的值。在本例中,我们将新列命名为 'Salary',并使用示例值替换 values_list。
# 添加 'Salary' 列
df['Salary'] = [56000, 72000, 45000, 86000]
print(df)
输出结果如下:
Name Age Gender Salary
0 Alice 25 F 56000
1 Bob 32 M 72000
2 Charlie 18 M 45000
3 David 47 M 86000
接下来,我们将添加另一列名为 'Department' 的新数据列,该列将包含员工所在的部门信息。
使用与前面相同的语法,添加第二列:
# 添加 'Department' 列
df['Department'] = ['HR', 'Marketing', 'Sales', 'IT']
print(df)
输出结果如下:
Name Age Gender Salary Department
0 Alice 25 F 56000 HR
1 Bob 32 M 72000 Marketing
2 Charlie 18 M 45000 Sales
3 David 47 M 86000 IT
使用 Pandas 加入一列或两列数据很容易。只需创建一个新列并将其添加到 DataFrame 对象中即可。这个过程可以反复执行,以在需要时添加任意数量的新列。