📜  Pandas.replace()(1)

📅  最后修改于: 2023-12-03 14:45:05.110000             🧑  作者: Mango

Pandas.replace()

Pandas是一个数据分析和数据操控工具,提供了许多强大的函数来处理数据。replace函数可以帮助我们在DataFrame或Series中用新的值替换旧值。

语法
pandas.DataFrame.replace(to_replace=None, value=None, inplace=False, limit=None, regex=False, method='pad')
参数
  • to_replace:要替换的值,可以是单独的值、列表、字典或正则表达式
  • value:用来替换to_replace的值
  • inplace:是否在DataFrame或Series上修改
  • limit:最大替换数量
  • regex:是否根据正则表达式替换
  • method:替换方法,有'pad'、'backfill'、'bfill'、'ffill'、'nearest'可选
示例

首先,让我们创建一个示例DataFrame:

import pandas as pd
import numpy as np

data = {'A': ['foo', 'bar', 'baz'], 'B': [1, 2, 3], 'C': [4.0, 5.0, 6.0]}
df = pd.DataFrame(data)
print(df)

输出:

     A  B    C
0  foo  1  4.0
1  bar  2  5.0
2  baz  3  6.0

让我们将'A'列中的'bar'替换为'foobar':

df.replace(to_replace='bar', value='foobar', inplace=True)
print(df)

输出:

        A  B    C
0     foo  1  4.0
1  foobar  2  5.0
2     baz  3  6.0

将'A'列中的'f'替换为'e':

df.replace(to_replace='f', value='e', inplace=True, regex=True)
print(df)

输出:

        A  B    C
0     eoo  1  4.0
1  eooebar  2  5.0
2     baz  3  6.0

将'C'列中的4和5替换为NaN:

df.replace(to_replace=[4, 5], value=np.nan, inplace=True)
print(df)

输出:

        A  B    C
0     eoo  1  NaN
1  eooebar  2  NaN
2     baz  3  6.0
结论

Pandas.replace()函数可以非常方便地替换DataFrame或Series中的值。它可以根据指定的条件、值、正则表达式进行替换,并且还可以控制替换数量和方法。