📜  读取 csv uisng pandas - Python (1)

📅  最后修改于: 2023-12-03 14:57:43.573000             🧑  作者: Mango

读取 CSV using pandas - Python

介绍

pandas 是一个功能强大的库,用于在 Python 中处理和分析具有标签行和列的数据。pandas 提供了许多函数来处理不同的数据格式。其中之一是处理 .csv 文件。

.csv 是一种常见的文件格式,它是用逗号分隔的值文件。它是一种常用的数据格式,经常被用在数据分析和数据科学中。pandas 的 read_csv 函数可以轻松地读取 .csv 文件并将其转换为 pandas 数据框。

代码示例

以下是使用 pandas 读取 .csv 文件的示例代码:

import pandas as pd

# 读取 csv 文件
df = pd.read_csv('filename.csv')

# 打印前 5 行数据
print(df.head())

上面的代码使用 read_csv 函数读取名为 filename.csv 的 .csv 文件,并将其转换为 pandas 数据框。然后,它使用 head 函数打印前 5 行数据。 head 函数可用于显示数据框的前几行。默认情况下,它显示前 5 行。这可以使用传递数字参数来更改。

可选参数

read_csv 函数有多个可选参数,可以帮助您读取和处理数据。以下是一些常用的可选参数:

sep

用于指定分隔符。默认为“,”。常用的分隔符包括逗号、制表符和分号。

pd.read_csv('filename.csv', sep='\t')  # 制表符分隔符
header

用于指定列名。默认情况下,列名由第一行解析得出。您可以使用 header=None 来指定没有列名。

pd.read_csv('filename.csv', header=None)  # 没有列名
nrows

用于指定要读取的行数。默认情况下,读取所有行。

pd.read_csv('filename.csv', nrows=100)  # 只读取前 100 行数据

这些是只要提供 read_csv 函数的一部分可选参数。有许多其他的可选参数可用于自定义读取和处理 .csv 文件。请查看 pandas 文档获取更多信息。

结论

在本文中,我们介绍了使用 pandas 读取 .csv 文件的简单方法。我们还讨论了一些常见的可选参数,可以帮助您自定义读取和处理 .csv 文件的方式。