📜  Pandas – 如何打乱 DataFrame 行(1)

📅  最后修改于: 2023-12-03 15:18:14.313000             🧑  作者: Mango

Pandas – 如何打乱 DataFrame 行

在数据分析和机器学习中,经常需要在数据集中随机选择一些数据。在 Pandas 中,可以使用 sample 函数对 DataFrame 进行打乱行的操作。

下面是一个示例 DataFrame:

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50]})
print(df)

输出结果:

   A   B
0  1  10
1  2  20
2  3  30
3  4  40
4  5  50
打乱 DataFrame 行

使用 sample 函数打乱 DataFrame 行,可以传递 frac 参数指定要保留多少行,或传递 n 参数指定要选择多少行:

# 打乱前 3 行
print(df[:3].sample(frac=1))

# 打乱全部行
print(df.sample(frac=1))

# 选择 3 行并打乱
print(df.sample(n=3))

输出结果:

   A   B
2  3  30
1  2  20
0  1  10

   A   B
0  1  10
3  4  40
4  5  50
1  2  20
2  3  30

   A   B
4  5  50
0  1  10
3  4  40

可以看到,使用 sample 函数可以轻松打乱 DataFrame 行。