📅  最后修改于: 2023-12-03 15:18:14.313000             🧑  作者: Mango
在数据分析和机器学习中,经常需要在数据集中随机选择一些数据。在 Pandas 中,可以使用 sample
函数对 DataFrame 进行打乱行的操作。
下面是一个示例 DataFrame:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50]})
print(df)
输出结果:
A B
0 1 10
1 2 20
2 3 30
3 4 40
4 5 50
使用 sample
函数打乱 DataFrame 行,可以传递 frac
参数指定要保留多少行,或传递 n
参数指定要选择多少行:
# 打乱前 3 行
print(df[:3].sample(frac=1))
# 打乱全部行
print(df.sample(frac=1))
# 选择 3 行并打乱
print(df.sample(n=3))
输出结果:
A B
2 3 30
1 2 20
0 1 10
A B
0 1 10
3 4 40
4 5 50
1 2 20
2 3 30
A B
4 5 50
0 1 10
3 4 40
可以看到,使用 sample
函数可以轻松打乱 DataFrame 行。