📜  如何在 python 中读取 csv 文件(1)

📅  最后修改于: 2023-12-03 15:08:45.787000             🧑  作者: Mango

如何在 Python 中读取 CSV 文件

CSV(Comma Separated Values)是一种常用的文本文件格式,经常用于存储和传输数据,尤其是数值数据。在 Python 中,我们可以使用 CSV 模块来读取和处理 CSV 文件。

CSV 文件的基本格式

CSV 文件的基本格式是由多行和多列组成的表格。每行代表一个数据记录,每列代表一种数据类型。

在每行数据记录中,数据项之间用逗号分隔,可以用引号或双引号将某些数据项括起来,以便在数据项中使用逗号或换行符。

以下是一个简单的 CSV 文件示例:

Name, Age, City
John, 25, New York
Alice, 30, San Francisco
Bob, 35, Chicago
如何读取 CSV 文件

在 Python 中,使用 CSV 模块可以很容易地读取 CSV 文件。首先,我们需要导入 CSV 模块:

import csv

接下来,我们可以使用 csv.reader() 方法从 CSV 文件中读取数据。该方法返回一个迭代器对象,其中每个元素是一行数据记录。

with open('data.csv', 'r') as csvfile:
    reader = csv.reader(csvfile)
    for row in reader:
        print(row)

上述代码中,data.csv 是 CSV 文件的文件名,'r' 表示以只读模式打开文件。在 with 语句块中,使用 csv.reader() 方法将文件内容读取为一个迭代器对象,然后使用 for 循环遍历这个迭代器对象,输出每一行的数据记录。

我们还可以使用 csv.DictReader() 方法读取 CSV 文件,并将每行数据记录转换为一个字典对象。在字典对象中,列名称作为键,列数据作为值。

with open('data.csv', 'r') as csvfile:
    reader = csv.DictReader(csvfile)
    for row in reader:
        print(row)

上述代码中,dict_reader 是一个 csv.DictReader() 方法返回的迭代器对象。在 for 循环中,我们对每一行数据记录进行了遍历,并输出了转换后的字典对象。

CSV 文件的其他读取方式

除了使用 CSV 模块之外,我们还可以使用 pandas 库来读取和处理 CSV 文件。pandas 是 Python 中的一种数据分析工具,可以方便地读取和处理各种格式的数据,包括 CSV 文件。

要使用 pandas 读取 CSV 文件,我们需要先安装 pandas:

pip install pandas

然后,在 Python 中导入 pandas 库:

import pandas as pd

接下来,我们可以使用 pd.read_csv() 方法来读取 CSV 文件。

df = pd.read_csv('data.csv')
print(df.head())

上述代码中,df 是一个 pandas 中的 DataFrame 对象,它表示 CSV 文件中的数据表格。在 df.head() 方法中,我们使用了 pandas 中的一个方法来显示前几行数据。

使用 pandas 读取 CSV 文件的好处是,它可以轻松地处理大型数据集,并直接提供各种数据处理和分析的功能,例如数据过滤、数据排序、数据分组、数据聚合、统计和可视化等。因此,在处理复杂的数据分析任务时,使用 pandas 可以大大提高我们的工作效率。

总结

通过本篇文章的介绍,我们了解了如何在 Python 中读取 CSV 文件,并通过 CSV 模块和 pandas 库演示了两种不同的读取方式。无论是使用 CSV 模块还是使用 pandas 库,都可以轻松地读取和处理 CSV 文件,使得我们能够高效地处理和分析各种数据集。