从 Pandas DataFrame 中的列中获取唯一值
让我们讨论如何从 Pandas DataFrame 中的列中获取唯一值。
使用列表字典创建一个简单的数据框,例如列名称为A、B、C、D、E和重复元素。
现在,让我们获取此数据框中列的唯一值。
示例 #1:获取 'B' 列的唯一值
# Import pandas package
import pandas as pd
# create a dictionary with five fields each
data = {
'A':['A1', 'A2', 'A3', 'A4', 'A5'],
'B':['B1', 'B2', 'B3', 'B4', 'B4'],
'C':['C1', 'C2', 'C3', 'C3', 'C3'],
'D':['D1', 'D2', 'D2', 'D2', 'D2'],
'E':['E1', 'E1', 'E1', 'E1', 'E1'] }
# Convert the dictionary into DataFrame
df = pd.DataFrame(data)
# Get the unique values of 'B' column
df.B.unique()
输出:
示例 #2:获取 'E' 列的唯一值
# Import pandas package
import pandas as pd
# create a dictionary with five fields each
data = {
'A':['A1', 'A2', 'A3', 'A4', 'A5'],
'B':['B1', 'B2', 'B3', 'B4', 'B4'],
'C':['C1', 'C2', 'C3', 'C3', 'C3'],
'D':['D1', 'D2', 'D2', 'D2', 'D2'],
'E':['E1', 'E1', 'E1', 'E1', 'E1'] }
# Convert the dictionary into DataFrame
df = pd.DataFrame(data)
# Get the unique values of 'E' column
df.E.unique()
输出:
示例 #3:获取列中唯一值的数量
# Import pandas package
import pandas as pd
# create a dictionary with five fields each
data = {
'A':['A1', 'A2', 'A3', 'A4', 'A5'],
'B':['B1', 'B2', 'B3', 'B4', 'B4'],
'C':['C1', 'C2', 'C3', 'C3', 'C3'],
'D':['D1', 'D2', 'D2', 'D2', 'D2'],
'E':['E1', 'E1', 'E1', 'E1', 'E1'] }
# Convert the dictionary into DataFrame
df = pd.DataFrame(data)
# Get number of unique values in column 'C'
df.C.nunique(dropna = True)
输出: