📅  最后修改于: 2023-12-03 15:26:41.773000             🧑  作者: Mango
在数据处理过程中,有时候需要根据一列数据的值来修改另一列数据的值,这时候可以使用 pandas 库来实现。
我们先来创建一个示例数据,包含两列:A列和B列。A列中的值为 0 或 1,B列中的值为对应的文本表示。
import pandas as pd
df = pd.DataFrame({
'A': [0, 0, 1, 1],
'B': ['zero', 'zero', 'one', 'one']
})
print(df)
输出结果为:
A B
0 0 zero
1 0 zero
2 1 one
3 1 one
我们的目标是将 B 列中的值,根据 A 列中的值进行修改。如果 A 列中的值为 0,则将 B 列中的值改为 zero_new;如果 A 列中的值为 1,则将 B 列中的值改为 one_new。
代码如下:
df.loc[df['A'] == 0, 'B'] = 'zero_new'
df.loc[df['A'] == 1, 'B'] = 'one_new'
print(df)
输出结果为:
A B
0 0 zero_new
1 0 zero_new
2 1 one_new
3 1 one_new
可以看到,B 列中的值已经被成功修改了。
以上就是根据另一列 pandas 更改列值的方法。通过 loc 函数,可以根据条件快速修改数据框中的值。这是一种比较常见的数据清洗操作,掌握这种技能可以提高数据处理的效率。