pandas read csv skip until expression found - Python (1)

📌 相关文章

📜 pandas read csv skip until expression found - Python (1)

📅 最后修改于: 2023-12-03 15:03:28.464000 🧑 作者: Mango

Pandas Read CSV Skip Until Expression Found - Python

在使用 Pandas 读取 CSV 文件时，有时候需要跳过文件中某个特定表达式之前的所有数据。这个问题可以通过 Pandas 的 skiprows 参数来解决。

以下是一个示例代码，该代码从 my_file.csv 文件中读取数据，并跳过了文件中所有行直到第一个 "Expression to skip until" 出现的行。

import pandas as pd

# 从 CSV 文件中读取数据，并跳过文件中跳过表达式之前的所有数据
df = pd.read_csv('my_file.csv', skiprows=lambda x: x < 0 or 'Expression to skip until' not in x)

# 打印读取到的数据
print(df)

这个 skiprows 参数是一个函数，可以使用 lambda 表达式。该函数接收一个整数参数 x，表示要跳过的行的索引。如果这个函数返回一个 True，那么这一行将会被跳过，反之则不会被跳过。

在上述示例中，lambda 表达式检查当前行 x 是否包含 "Expression to skip until"。如果不包含该表达式，该函数将返回 True，使得该行数据被跳过；否则，该函数返回 False，该行数据将被读取到 DataFrame 中。

总之，可以使用 skiprows 参数来跳过 CSV 文件中的特定行，这在读取一个庞大的、日志类型的文件时，特别方便。