📅  最后修改于: 2023-12-03 15:23:14.647000             🧑  作者: Mango
当您处理 Pandas DataFrame 时,经常需要获取唯一值,以便进一步分析数据。这篇文章将介绍如何在 Pandas DataFrame 中的所有列中查找唯一值。
要查找 Pandas DataFrame 中单列的唯一值,可以使用 unique()
方法。例如,假设我们有一个名为 df
的 DataFrame,其中有一个名为 color
的列,我们可以使用以下命令查找 color
列的唯一值:
unique_colors = df['color'].unique()
这将返回一个 NumPy 数组,其中包含 color
列的所有唯一值。
如果您需要查找整个 Pandas DataFrame 的唯一值,则可以在 DataFrame 上调用 unstack()
方法,然后使用 unique()
方法。例如,以下命令将返回 DataFrame 所有列的唯一值:
unique_values = df.unstack().unique()
这将返回一个 NumPy 数组,其中包含 DataFrame 的所有唯一值。
如果您需要将唯一值转换为 Pandas DataFrame,则可以使用 NumPy 数组和 reshape()
方法。例如,以下命令会将唯一值转换为 DataFrame:
unique_values_df = pd.DataFrame(unique_values.reshape(-1, len(df.columns)))
这将返回一个 DataFrame,其中每行表示一个唯一值,每列表示一个原始 DataFrame 的列。
这些命令将使您能够轻松地查找和分析 Pandas DataFrame 中的唯一值。