📅  最后修改于: 2023-12-03 15:24:43.613000             🧑  作者: Mango
在处理大型数据集时,我们经常需要将数据保存在 gzipzip 文件中以减小文件大小并提高数据下载速度。使用Pandas可以很方便地将数据保存为 gzipzip 文件。
以下是将 Pandas DataFrame 保存为 gzipzip 文件的步骤:
我们需要首先导入 Pandas 和 gzipzip 模块。
import pandas as pd
import gzip
我们需要准备数据以保存为 gzipzip 文件。这里我们使用一个示例数据来演示。
data = {'Name': ['Tom', 'John', 'Tom', 'John', 'Marry'], 'Age': [25, 27, 34, 23, 29], 'Sex': ['M', 'M', 'M', 'M', 'F'], 'City': ['London', 'New York', 'Paris', 'Beijing', 'Sydney']}
df = pd.DataFrame(data)
我们可以使用 Pandas 的 to_csv()
函数将 DataFrame 保存为 gzipzip 文件。以下是代码示例:
with gzip.GzipFile('data.csv.gz', mode='w') as file:
df.to_csv(file, index=False)
这将创建一个名为 data.csv.gz
的 gzipzip 文件,并将 DataFrame 保存到其中。请注意,我们需要将 mode
参数设置为 'w',以指定写入模式。
我们可以使用 Pandas 的 read_csv()
函数读取 gzipzip 文件中的 DataFrame。以下是代码示例:
with gzip.open('data.csv.gz', mode='r') as file:
df = pd.read_csv(file)
print(df)
输出:
Name Age Sex City
0 Tom 25 M London
1 John 27 M New York
2 Tom 34 M Paris
3 John 23 M Beijing
4 Marry 29 F Sydney
这将读取之前保存的 gzipzip 文件,并将其转换为 DataFrame。
这篇文章介绍了将 Pandas DataFrame 保存为 gzipzip 文件的步骤。我们需要使用 gzip 模块来创建 gzipzip 文件,并使用 Pandas 的 to_csv()
函数将 DataFrame 写入文件。同时,我们可以使用 Pandas 的 read_csv()
函数从 gzipzip 文件中读取 DataFrame。