📜  Python|使用 pandas.read_csv() 读取 csv(1)

📅  最后修改于: 2023-12-03 15:04:23.995000             🧑  作者: Mango

使用 pandas.read_csv() 读取 csv 文件

简介

在 Python 中,可以使用 pandas 库的 read_csv() 函数来读取和处理 csv 文件。pandas 是一个强大的数据分析库,它提供了许多用于数据操作和分析的函数和工具。

读取 csv 文件

下面是使用 pandas.read_csv() 函数读取 csv 文件的基本语法:

import pandas as pd

data = pd.read_csv('file.csv')

read_csv() 函数的参数中需要指定 csv 文件的路径,可以是相对路径或绝对路径。读取成功后,数据将被存储在一个称为 DataFrame 的二维表中,你可以使用该对象进行数据操作和分析。

进阶用法
自定义分隔符

如果你的 csv 文件使用的不是逗号(,)作为分隔符,你可以通过 sep 参数来指定分隔符。例如,如果分隔符是分号(;),你可以使用以下语法:

data = pd.read_csv('file.csv', sep=';')
自定义列名

如果你的 csv 文件不包含列名,并且希望在读取时手动指定列名,可以使用 header 参数。header=None 表示没有列名,你需要自己指定列名。例如:

data = pd.read_csv('file.csv', header=None, names=['Col1', 'Col2', 'Col3'])

这将使用自定义的列名 Col1Col2Col3 来读取 csv 文件。

跳过行

如果你的 csv 文件包含一些无关的行,你可以使用 skiprows 参数来跳过这些行。例如,如果你想跳过前两行,可以使用以下语法:

data = pd.read_csv('file.csv', skiprows=2)
缺失值处理

在读取 csv 文件时,默认情况下 pandas 将使用 NaN 值表示缺失值。你可以使用 na_values 参数来指定其他的缺失值标识符,并将其转换为 NaN 值。例如,如果你的缺失值标识符是 NULL-1,可以使用以下语法:

data = pd.read_csv('file.csv', na_values=['NULL', -1])
更多选项

pandas.read_csv() 函数还有其他许多可用选项,如指定数据类型、日期解析等。你可以参考 官方文档 来了解更多详情。

总结

使用 pandas.read_csv() 函数读取 csv 文件非常简单,你可以使用各种参数来自定义读取行为。读取后的数据将被存储在 DataFrame 对象中,便于进行后续的数据操作和分析。

希望这个介绍对你有帮助!