📜  Python Pandas-函数应用程序

📅  最后修改于: 2020-11-06 05:40:13             🧑  作者: Mango


要将您自己的或另一个库的功能应用于Pandas对象,您应该了解这三种重要方法。该方法已在下面讨论。使用的适当方法取决于您的函数希望对整个DataFrame进行操作,还是按行或按列,或者按元素进行操作。

  • 逐表函数应用程序:pipe()
  • 行或列明智功能应用程序:apply()
  • 元素明智的功能应用程序:applymap()

逐表函数应用

可以通过传递函数和适当数量的参数作为管道参数来执行自定义操作。因此,对整个DataFrame执行操作。

例如,将值2添加到DataFrame中的所有元素。然后,

加法器函数

加法器函数将两个数值相加并返回总和。

def adder(ele1,ele2):
   return ele1+ele2

现在,我们将使用自定义函数对DataFrame进行操作。

df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
df.pipe(adder,2)

让我们看看完整的程序-

import pandas as pd
import numpy as np

def adder(ele1,ele2):
   return ele1+ele2

df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
df.pipe(adder,2)
print df.apply(np.mean)

输出如下-

col1       col2       col3
0   2.176704   2.219691   1.509360
1   2.222378   2.422167   3.953921
2   2.241096   1.135424   2.696432
3   2.355763   0.376672   1.182570
4   2.308743   2.714767   2.130288

行或列明智功能应用程序

可以使用apply()方法沿DataFrame或Panel的轴应用任意函数,该方法与描述性统计方法一样,采用可选的axis参数。默认情况下,该操作按列执行,将每一列视为类似数组的形式。

例子1

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
df.apply(np.mean)
print df.apply(np.mean)

输出如下-

col1   -0.288022
col2    1.044839
col3   -0.187009
dtype: float64

通过传递参数,可以逐行执行操作。

例子2

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
df.apply(np.mean,axis=1)
print df.apply(np.mean)

输出如下-

col1    0.034093
col2   -0.152672
col3   -0.229728
dtype: float64  

例子3

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
df.apply(lambda x: x.max() - x.min())
print df.apply(np.mean)

输出如下-

col1   -0.167413
col2   -0.370495
col3   -0.707631
dtype: float64

元素明智功能应用

并非所有函数都可以向量化(NumPy数组都不返回另一个数组,也不返回任何值), DataFrame上的applymap ()方法和Series上的map()类似地接受任何采用单个值并返回单个值的Python函数。

例子1

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])

# My custom function
df['col1'].map(lambda x:x*100)
print df.apply(np.mean)

输出如下-

col1    0.480742
col2    0.454185
col3    0.266563
dtype: float64

例子2

import pandas as pd
import numpy as np

# My custom function
df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
df.applymap(lambda x:x*100)
print df.apply(np.mean)

输出如下-

col1    0.395263
col2    0.204418
col3   -0.795188
dtype: float64