📅  最后修改于: 2020-10-29 02:52:06             🧑  作者: Mango
我们可以使用不同的方式将新列添加到现有DataFrame中。对于演示,首先,我们必须编写代码以读取现有文件,该文件由DataFrame中的某些列组成。
import pandas as pd
aa = pd.read_csv("aa.csv")
aa.head()
上面的代码读取了现有的csv文件,并将数据值列显示为输出。
输出量
Name | Hire Date | Salary | Leaves Remaining |
---|---|---|---|
0 John Idle | 03/15/14 | 50000.0 | 10 |
1 Smith Gilliam | 06/01/15 | 65000.0 | 8 |
2 Parker Chapman | 05/12/14 | 45000.0 | 10 |
3 Jones Palin | 11/01/13 | 70000.0 | 3 |
4 Terry Gilliam | 08/12/14 | 48000.0 | 7 |
5 Michael Palin | 05/23/13 | 66000.0 | 8 |
如果要在表末尾添加任何新列,则必须使用[]运算符。让我们在“ aa” csv文件中添加一个名为“ Age”的新列。
import pandas as pd
aa = pd.read_csv("aa.csv")
aa["Age"] = "24"
aa.head()
此代码在aa csv文件的末尾添加了“年龄”列。因此,添加列后的新表将如下所示:
Name Hire Date Salary Leaves Remaining Age
0 John Idle 03/15/14 50000.0 10 24
1 Smith Gilliam 06/01/15 65000.0 8 24
2 Parker Chapman 05/12/14 45000.0 10 24
3 Jones Palin 11/01/13 70000.0 3 24
4 Terry Gilliam 08/12/14 48000.0 7 24
5 Michael Palin 05/23/13 66000.0 8 24
在上面的代码中,Age值定义了通用值,这意味着其值对于所有行都是通用的。如果我们指定的列名不存在,Pandas将抛出错误。
例如:
aa["Designation"]
在上面的代码中,Pandas将引发错误,因为“指定”列不存在。
但是,如果我们为该列分配一个值,Pandas将在表末尾自动生成一个新列。
我们还可以使用方法名称插入在现有DataFrame中的任何位置添加一个新列。
对于演示,首先,我们必须编写代码以读取包含DataFrame中某些列的现有文件。
import pandas as pd
aa = pd.read_csv("aa.csv")
aa.head()s
上面的代码读取了现有的csv文件,并在输出中显示了data values列。
输出量
Name Hire Date Salary Leaves Remaining
0 John Idle 03/15/14 50000.0 10
1 Smith Gilliam 06/01/15 65000.0 8
2 Parker Chapman 05/12/14 45000.0 10
3 Jones Palin 11/01/13 70000.0 3
4 Terry Gilliam 08/12/14 48000.0 7
5 Michael Palin 05/23/13 66000.0 8
让我们使用insert方法将新列名称“部门”添加到现有的“ aa” csv文件中。
import pandas as pd
aa = pd.read_csv("aa.csv")
aa.insert(2, column = "Department", value = "B.Sc")
aa.head()
输出量
Name Hire Date Department Salary Leaves Remaining
0 John Idle 03/15/14 B.Sc 50000.0 10
1 Smith Gilliam 06/01/15 B.Sc 65000.0 8
2 Parker Chapman 05/12/14 B.Sc 45000.0 10
3 Jones Palin 11/01/13 B.Sc 70000.0 3
4 Terry Gilliam 08/12/14 B.Sc 48000.0 7
5 Michael Palin 05/23/13 B.Sc 66000.0 8