📅  最后修改于: 2023-12-03 15:03:28.474000             🧑  作者: Mango
当我们在使用 Pandas 读取 CSV 文件的时候,有时候我们需要随机选择其中的某些行,或者我们需要在遍历整个 CSV 文件之前先取出一定数量的随机行,这时候该怎么做呢?下面是一些方法和代码片段供参考。
import pandas as pd
# 读取 CSV 文件,sep 表示该文件中各元素之间的分隔符(如逗号、制表符等)
df = pd.read_csv('your_file.csv', sep=',')
# 使用 sample 函数获取随机行,参数 n 表示取出的行数
random_sample = df.sample(n=10)
# 打印输出获取的随机行
print(random_sample)
通过使用 Pandas 中的 sample
函数,我们可以方便地从 CSV 文件中获取指定数量的随机行。其中,n
参数确定了获取的随机行数。
import pandas as pd
import random
# 读取 CSV 文件,sep 表示该文件中各元素之间的分隔符(如逗号、制表符等)
df = pd.read_csv('your_file.csv', sep=',')
# 随机生成需要跳过的行数
skiprows = sorted(random.sample(range(1, len(df)), len(df)-10))
# 使用 skiprows 函数跳过随机行,获取剩余行数的 DataFrame
random_sample = pd.read_csv('your_file.csv', skiprows=skiprows)
# 打印输出获取的随机行
print(random_sample)
通过使用 Python 中的 random
函数,我们可以随机生成需要跳过的行数,然后使用 Pandas 中的 skiprows
函数来跳过这些行数。这样可以得到一个较小的新的 DataFrame,起到了随机行的效果。
以上是两种 Pandas 处理 CSV 文件中的随机行的方法,可以根据具体情况选择适合自己的方法。对于一些特殊的数据集,可能需要自己编写函数来实现随机行的处理。