📅  最后修改于: 2023-12-03 15:39:33.577000             🧑  作者: Mango
在编程过程中,我们经常需要循环遍历数据集并对数据进行操作。有时候需要在循环完毕后向数据集中添加新的变量。本文将介绍如何在循环后向数据集中添加新变量的方法。
我们可以使用 pandas 库来实现循环后向数据集中添加新变量的操作。下面是该方法的示范代码:
import pandas as pd
# 创建数据集
df = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie'],
'score': [80, 90, 75]
})
# 新增变量
new_column = []
for index, row in df.iterrows():
if row['score'] >= 80:
new_column.append('Pass')
else:
new_column.append('Fail')
# 添加新变量
df['result'] = new_column
# 输出数据集
print(df)
在上述示范代码中,首先我们创建了一个数据集 df
,它包含了两列数据 name
和 score
。然后我们需要循环遍历该数据集,在每次循环中判断分数是否大于或等于 80 分,如果是则将结果存储在 new_column
列表中,否则存储 Fail
。最后,我们使用 df['result'] = new_column
将新变量 result
添加到数据集中。
使用 pandas 库可以很方便地实现循环后向数据集中添加新变量的操作。通过上述方法,我们可以自由地对数据集进行操作并添加新的变量。