📅  最后修改于: 2023-12-03 15:10:19.196000             🧑  作者: Mango
在数据分析过程中,经常需要修改数据框(DataFrame)中的某些特定值,例如将特定数值替换为另一个数值。本文将介绍在Python中如何更改数据框某一列中的特定值。
在开始之前,我们先创建一个示例数据。
import pandas as pd
d = {'id': [1, 2, 3, 4],
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data=d)
print(df)
输出结果:
id name age gender
0 1 Alice 25 F
1 2 Bob 30 M
2 3 Charlie 35 M
3 4 David 40 M
我们想把数据框中所有年龄为25岁的人的年龄改为30岁。可以使用loc
方法,该方法可以根据行索引和列索引选择数据框中的特定值。
df.loc[df['age'] == 25, 'age'] = 30
print(df)
输出结果:
id name age gender
0 1 Alice 30 F
1 2 Bob 30 M
2 3 Charlie 35 M
3 4 David 40 M
我们想把数据框中所有男性的年龄加上5岁。可以使用loc
方法选择性更改数据框中的值。
df.loc[df['gender'] == 'M', 'age'] += 5
print(df)
输出结果:
id name age gender
0 1 Alice 30 F
1 2 Bob 35 M
2 3 Charlie 40 M
3 4 David 45 M
本文介绍了在Python中如何更改数据框某一列中的特定值,主要使用了loc
方法及条件语句。掌握这些技能可以更方便地进行数据分析和处理。