📜  如何计算 Pandas Groupby 对象中的唯一值?

📅  最后修改于: 2022-05-13 01:55:36.873000             🧑  作者: Mango

如何计算 Pandas Groupby 对象中的唯一值?

先决条件:熊猫

Groupby 顾名思义,就是根据某个值的相似性对属性进行分组。我们可以使用 groupby()、agg() 和 reset_index() 方法计算 pandas Groupby 对象中的唯一值。本文描述了如何使用 Pandas 检索数据框中某些属性的唯一值计数。

使用的功能

  • groupby() groupby()函数用于根据某些条件将数据分组。 pandas 对象可以在它们的任何轴上拆分。
  • agg() agg() 用于传递一个函数或函数列表,以分别应用于系列甚至系列的每个元素。在函数列表的情况下, agg() 方法返回多个结果。
  • reset-index() Pandas reset_index() 是一种重置数据帧索引的方法。 reset_index() 方法将范围从 0 到数据长度的整数列表设置为索引。

方法:

  • 导入库
  • 制作数据
  • 组数据
  • 使用聚合函数
  • 重置索引
  • 打印数据

示例 1:



Python
# import pandas
import pandas as pd
  
# create dataframe
df = pd.DataFrame({'Col_1': ['a', 'b', 'c', 'b', 'a', 'd'],
                   'Col_2': [1, 2, 3, 3, 2, 1]})
  
# print original dataframe
print("original dataframe:")
display(df)
  
  
# call groupby method.
df = df.groupby("Col_1")
  
# call agg method
df = df.agg({"Col_2": "nunique"})
  
# call reset_index method
df = df.reset_index()
  
# print dataframe
print("final dataframe:")
display(df)


Python
# import pandas
import pandas as pd
  
# create dataframe
df = pd.DataFrame({'Col_1': ['a', 'b', 'c', 'b', 'a', 'd'],
                   'Col_2': [1, 2, 3, 3, 2, 1]})
  
# print original dataframe
print("original dataframe:")
display(df)
  
  
# call groupby method.
df = df.groupby("Col_2")
  
# call agg method
df = df.agg({"Col_1": "nunique"})
  
# call reset_index method
df = df.reset_index()
  
# print dataframe
print("final data frame:")
display(df)


输出:

示例 2:

Python

# import pandas
import pandas as pd
  
# create dataframe
df = pd.DataFrame({'Col_1': ['a', 'b', 'c', 'b', 'a', 'd'],
                   'Col_2': [1, 2, 3, 3, 2, 1]})
  
# print original dataframe
print("original dataframe:")
display(df)
  
  
# call groupby method.
df = df.groupby("Col_2")
  
# call agg method
df = df.agg({"Col_1": "nunique"})
  
# call reset_index method
df = df.reset_index()
  
# print dataframe
print("final data frame:")
display(df)

输出: