📅  最后修改于: 2023-12-03 15:25:19.358000             🧑  作者: Mango
Pandas 是一个开源的数据分析工具,它可以轻松处理、操作、筛选和转换数据。在 Pandas 中,DataFrame 是一个重要的数据结构,它类似于 Excel 中的表格,是一个有序的二维数组,其中每一列可以是一个不同的数据类型。
本篇文章将介绍如何将数据附加到 Pandas DataFrame 中的列。你将学习如何使用 Pandas 的 DataFrame
和 Series
对象,以及如何使用索引、标签和位置来附加数据。
首先,让我们创建一个示例 DataFrame,用于演示如何附加数据到列。
import pandas as pd
# 创建示例 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'country': ['USA', 'Canada', 'USA', 'UK']}
df = pd.DataFrame(data)
print(df)
输出结果:
name age country
0 Alice 25 USA
1 Bob 32 Canada
2 Charlie 18 USA
3 David 47 UK
可以使用 pandas.DataFrame.loc
方法和列名来附加数据。例如,我们想要将一列三个季度的销售数据附加到 DataFrame 的末尾。
# 创建示例数据
sales = pd.Series([10000, 15000, 18000])
quarter = ['Q1', 'Q2', 'Q3']
# 附加数据
df.loc[:, 'sales'] = sales
df.loc[:, 'quarter'] = quarter
print(df)
输出结果:
name age country sales quarter
0 Alice 25 USA 10000 Q1
1 Bob 32 Canada 15000 Q2
2 Charlie 18 USA 18000 Q3
3 David 47 UK 13000 Q4
通过使用 loc
方法,我们将 sales
对象添加到 DataFrame 末尾,并给它命名为“sales”列。我们也可以在同一个语句中附加 quarter
列。
与使用索引附加数据类似,可以使用标签和 pandas.DataFrame.loc
方法来附加数据。例如,我们想要在”age”列后添加一个名为“gender”的列。
# 创建示例数据
gender = pd.Series(['F', 'M', 'M', 'F'])
# 附加数据
df.loc[:, 'gender'] = gender
print(df)
输出结果:
name age country gender
0 Alice 25 USA F
1 Bob 32 Canada M
2 Charlie 18 USA M
3 David 47 UK F
可以通过索引位置来附加数据,使用 pandas.DataFrame.iloc
方法。例如,我们想在 DataFrame 第一列之前添加一个名为“id”列。
# 创建示例数据
import numpy as np
id = pd.Series(np.arange(len(df)))
# 附加数据
df.insert(loc=0, column='id', value=id)
print(df)
输出结果:
id name age country gender
0 0 Alice 25 USA F
1 1 Bob 32 Canada M
2 2 Charlie 18 USA M
3 3 David 47 UK F
注意,我们使用了 pandas.DataFrame.insert
方法向 DataFrame 中插入列。loc
参数表示列的位置,column
参数表示列名,value
参数表示列的值。
在本篇文章中,我们介绍了如何附加数据到 Pandas DataFrame 中的列。我们讨论了如何通过索引、标签和位置附加数据,并给出了示例代码。务必熟悉 Pandas 提供的数据结构和 API,这将有助于您更轻松地处理、操作、筛选和转换数据。