📜  pandas read csv skip until expression found - Python (1)

📅  最后修改于: 2023-12-03 15:03:28.464000             🧑  作者: Mango

Pandas Read CSV Skip Until Expression Found - Python

在使用 Pandas 读取 CSV 文件时,有时候需要跳过文件中某个特定表达式之前的所有数据。这个问题可以通过 Pandas 的 skiprows 参数来解决。

以下是一个示例代码,该代码从 my_file.csv 文件中读取数据,并跳过了文件中所有行直到第一个 "Expression to skip until" 出现的行。

import pandas as pd

# 从 CSV 文件中读取数据,并跳过文件中跳过表达式之前的所有数据
df = pd.read_csv('my_file.csv', skiprows=lambda x: x < 0 or 'Expression to skip until' not in x)

# 打印读取到的数据
print(df)

这个 skiprows 参数是一个函数,可以使用 lambda 表达式。该函数接收一个整数参数 x,表示要跳过的行的索引。如果这个函数返回一个 True,那么这一行将会被跳过,反之则不会被跳过。

在上述示例中,lambda 表达式检查当前行 x 是否包含 "Expression to skip until"。如果不包含该表达式,该函数将返回 True,使得该行数据被跳过;否则,该函数返回 False,该行数据将被读取到 DataFrame 中。

总之,可以使用 skiprows 参数来跳过 CSV 文件中的特定行,这在读取一个庞大的、日志类型的文件时,特别方便。