📜  Pandas DataFrame.pivot_table()

📅  最后修改于: 2020-10-29 02:13:26             🧑  作者: Mango

Pandas DataFrame.pivot_table()

Pandas Pivot_table()用于计算,汇总和汇总数据。它被定义为功能强大的工具,可通过汇总,计数,平均值,最大值和最小值等计算来汇总数据。

创建数据透视表后,它还允许用户对数据进行排序和过滤。

参数:

  • data:一个DataFrame。
  • values:这是一个可选参数,引用该列进行汇总。
  • index:它是指列,Grouper和数组。

如果我们传递一个数组,则它必须与数据具有相同的长度。

  • columns:引用列,Grouper和数组

如果我们传递一个数组,则它必须与数据具有相同的长度。

  • aggfunc: 函数列表,字典,默认numpy.mean如果我们传递函数列表,则生成的数据透视表将具有层次结构列,其顶层是函数名称。如果我们通过字典,则该键称为要聚合的列,而值是函数或函数列表。
  • fill_value [标量,默认为无]:它将缺失的值替换为一个值。
  • margins [布尔值,默认为False]:将所有行/列相加(例如,小计/总计)
  • dropna [boolean,default True]:删除条目均为NaN的列。
  • margins_name [字符串,默认为’All’]:它是指行/列的名称,当行距为True时将包含总计。

返回值:

它返回一个DataFrame作为输出。

例:

# importing pandas as pd 
import pandas as pd 
import numpy as np 
   
# create dataframe 
info = pd.DataFrame({'P': ['Smith', 'John', 'William', 'Parker'], 
      'Q': ['Python', 'C', 'C++', 'Java'], 
      'R': [19, 24, 22, 25]}) 
info 
table = pd.pivot_table(info, index =['P', 'Q'])   
table

输出量

    P          Q         R
   John       C         24
   Parker     Java      25
   Smith      Python    19
   William    C         22