📅  最后修改于: 2023-12-03 14:50:41.536000             🧑  作者: Mango
在数据分析中,有时需要向已有的数据框中插入新的列。本文将介绍如何使用Python中的pandas库向数据框中插入新列。具体内容分为以下几个部分:
要实现向数据框中插入新列的功能,我们需要导入pandas库。如果尚未安装此库,可以使用以下命令进行安装:
pip install pandas
导入pandas库的代码如下:
import pandas as pd
接下来,我们需要创建一个数据框。本文使用的数据框是一个包含学生姓名、年龄和成绩的数据框:
data = {'姓名': ['小明', '小红', '小张', '小李'],
'年龄': [18, 19, 20, 21],
'成绩': [90, 85, 95, 87]}
df = pd.DataFrame(data)
在jupyter notebook中运行以上代码,我们可以得到如下数据框:
| | 姓名 | 年龄 | 成绩 | |:-:|:---:|:---:|:---:| | 0 | 小明 | 18 | 90 | | 1 | 小红 | 19 | 85 | | 2 | 小张 | 20 | 95 | | 3 | 小李 | 21 | 87 |
接下来,我们将向数据框中插入一个新的列“班级”,并将所有数据的班级设置为“一班”。新列的插入可以使用以下代码实现:
df['班级'] = '一班'
我们可以通过以下代码查看插入新列后的数据框:
print(df)
输出结果如下:
| | 姓名 | 年龄 | 成绩 | 班级 | |:-:|:---:|:---:|:---:|:---:| | 0 | 小明 | 18 | 90 | 一班 | | 1 | 小红 | 19 | 85 | 一班 | | 2 | 小张 | 20 | 95 | 一班 | | 3 | 小李 | 21 | 87 | 一班 |
另外,我们也可以向新列中插入已有的数据,例如:
df['班级'] = ['一班', '一班', '二班', '二班']
插入后的数据框如下所示:
| | 姓名 | 年龄 | 成绩 | 班级 | |:-:|:---:|:---:|:---:|:---:| | 0 | 小明 | 18 | 90 | 一班 | | 1 | 小红 | 19 | 85 | 一班 | | 2 | 小张 | 20 | 95 | 二班 | | 3 | 小李 | 21 | 87 | 二班 |
如果需要删除数据框中的新列,可以使用以下代码实现:
df.drop('班级', axis=1, inplace=True)
其中,drop函数中的axis=1表示按列进行操作,inplace=True表示直接对原数据框进行操作。我们可以通过以下代码查看删除后的数据框:
print(df)
删除后的数据框如下所示:
| | 姓名 | 年龄 | 成绩 | |:-:|:---:|:---:|:---:| | 0 | 小明 | 18 | 90 | | 1 | 小红 | 19 | 85 | | 2 | 小张 | 20 | 95 | | 3 | 小李 | 21 | 87 |
至此,本文介绍了如何向数据框中插入新列以及删除新列的方法,希望读者能够掌握并灵活运用。