📜  将数据集从 python 导出到 csv - Python (1)

📅  最后修改于: 2023-12-03 15:09:36.893000             🧑  作者: Mango

将数据集从 Python 导出到 CSV

CSV (Comma Separated Values) 是一种常见的数据交换格式。Python 提供了多种方法将数据集导出为 CSV 文件。

使用 CSV 模块

Python 内置的 CSV 模块提供了一种简单的方式将数据集导出为 CSV 格式。下面是一个示例代码:

import csv

data = [["john", "doe", "john.doe@example.com"],
        ["jane", "doe", "jane.doe@example.com"],
        ["bob", "smith", "bob.smith@example.com"]]

with open("output.csv", "w", newline="") as f:
    writer = csv.writer(f)
    for row in data:
        writer.writerow(row)

首先,我们导入了 CSV 模块。然后创建了一个包含数据的列表。接下来,我们使用 with open 语句打开文件 output.csv 用于写入,并创建了一个 CSV writer 对象 writer。我们使用 writer.writerow 方法将每行数据写入到文件中。

需要注意的是,open 函数打开文件时需要指定 newline 参数为空字符串。这是因为 CSV 文件中的行分隔符为 ",而在 Windows 操作系统上使用默认的 "\r\n" 会导致写入的数据出现额外的空行。

使用 pandas 库

pandas 是 Python 中常用的数据处理库。它提供了灵活的 API 和高效的数据处理能力。下面是使用 pandas 导出数据集为 CSV 文件的示例代码:

import pandas as pd

data = [["john", "doe", "john.doe@example.com"],
        ["jane", "doe", "jane.doe@example.com"],
        ["bob", "smith", "bob.smith@example.com"]]

df = pd.DataFrame(data, columns=["First Name", "Last Name", "Email"])
df.to_csv("output.csv", index=False)

首先,我们导入了 pandas 模块并创建了一个包含数据的列表。接下来,我们使用 pd.DataFrame 函数创建了一个包含数据的 DataFrame 对象,并指定了每列数据的列名。最后,我们使用 to_csv 方法将 DataFrame 对象导出为 CSV 文件。

需要注意的是,to_csv 方法中的 index 参数默认为 True,表示将 DataFrame 的索引写入 CSV 文件。如果不需要写入索引,可以将 index 参数设置为 False

结束语

本文介绍了使用 Python 将数据集导出为 CSV 文件的两种方式:使用 CSV 模块和 pandas 库。通过这些方法,我们可以方便地将数据集导出为通用的 CSV 格式,并进行后续的数据分析和处理。