📅  最后修改于: 2023-12-03 15:12:48.656000             🧑  作者: Mango
在数据分析中,熊猫(Pandas)是一个十分强大的工具。而在使用熊猫数据框时,有时需要把多个数据框合并在一起,或者将新的行或列添加到数据框中,这时就需要用到“附加”操作。本文将介绍在Python中如何使用Pandas进行附加操作。
附加操作可以将两个熊猫数据框沿着某个轴(通常是行轴)拼接在一起。可以通过concat函数实现附加操作。例如,我们有两个数据框df1和df2:
import pandas as pd
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3']},
index=[0, 1, 2, 3])
df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],
'B': ['B4', 'B5', 'B6', 'B7'],
'C': ['C4', 'C5', 'C6', 'C7'],
'D': ['D4', 'D5', 'D6', 'D7']},
index=[4, 5, 6, 7])
要将这两个数据框沿着行轴拼接在一起,只需要使用concat函数:
result = pd.concat([df1, df2])
输出的结果如下:
A B C D
0 A0 B0 C0 D0
1 A1 B1 C1 D1
2 A2 B2 C2 D2
3 A3 B3 C3 D3
4 A4 B4 C4 D4
5 A5 B5 C5 D5
6 A6 B6 C6 D6
7 A7 B7 C7 D7
有时候我们需要向已有的数据框中添加新的行。可以通过loc函数实现添加行的操作。
df1 = df1.append(pd.DataFrame({'A': 'A4', 'B': 'B4', 'C': 'C4', 'D': 'D4'}, index=[4]))
第一个参数是一个字典,它表示新行的数据。index参数用于设置新行的索引。
添加列时,我们需要先创建一个新的Series,然后通过赋值的方式添加到数据框中。例如,要向df1中添加新的列'E',可以这样做:
new_col = pd.Series(['E0', 'E1', 'E2', 'E3'], index=df1.index)
df1['E'] = new_col
本文介绍了如何在Python中使用Pandas进行附加操作,包括拼接数据框和添加行、添加列。熟练掌握这些操作,能够更加灵活地进行数据处理和分析。