📌  相关文章
📜  如何将多个 CSV 文件合并到一个 Pandas 数据框中?(1)

📅  最后修改于: 2023-12-03 15:38:45.422000             🧑  作者: Mango

如何将多个 CSV 文件合并到一个 Pandas 数据框中?

如果你需要将多个 CSV 文件中的数据合并到一个 Pandas 数据框中,可以使用 pandas.concat() 函数来实现。

1. 加载 CSV 文件并将其合并到一个数据框中

可以使用 pandas.read_csv() 函数来加载一个 CSV 文件,并使用 pandas.concat() 函数将多个数据框合并到一个数据框中。对于要合并的数据框,可以将其存储在一个列表中,并将该列表传递给 pandas.concat() 函数:

import pandas as pd

# 创建一个空的数据框
df = pd.DataFrame()

# 待合并数据框的文件名列表
file_names = ['file1.csv', 'file2.csv', 'file3.csv']

# 遍历文件名列表,读取 CSV 文件,并将其合并到一个数据框中
for file in file_names:
    temp_df = pd.read_csv(file)
    df = pd.concat([df, temp_df], ignore_index=True)

# 输出合并后的数据框
print(df)

在上面的代码中,我们首先创建了一个空的数据框 df。然后,我们定义了待合并数据框的文件名列表 file_names。接着,我们使用 for 循环遍历该列表,读取 CSV 文件并将其存储在一个临时数据框 temp_df 中。每次遍历时,我们使用 pandas.concat() 函数将临时数据框 temp_df 合并到空数据框 df 中。最后,我们输出合并后的数据框 df。

2. 使用 glob 模块来加载 CSV 文件并将其合并到一个数据框中

另一种常用的方法是使用 glob 模块来加载 CSV 文件,并使用 pandas.concat() 函数将它们合并到一个数据框中。glob 模块提供了一个函数,用于查找与指定模式匹配的文件路径名。我们可以使用该函数来查找所有要合并的 CSV 文件的文件路径名,并将其存储在一个列表中。接着,我们使用 for 循环遍历该列表,读取 CSV 文件并将其存储在一个临时数据框 temp_df 中。每次遍历时,我们使用 pandas.concat() 函数将临时数据框 temp_df 合并到空数据框 df 中。最后,我们输出合并后的数据框 df。

import pandas as pd
import glob

# 创建一个空的数据框
df = pd.DataFrame()

# 查找所有要合并的 CSV 文件的文件路径名,并将其存储在一个列表中
csv_files = glob.glob('*.csv')

# 遍历 CSV 文件列表,读取每个 CSV 文件,并将其合并到一个数据框中
for file in csv_files:
    temp_df = pd.read_csv(file)
    df = pd.concat([df, temp_df], ignore_index=True)

# 输出合并后的数据框
print(df)

在上面的代码中,我们首先创建了一个空的数据框 df。然后,我们使用 glob.glob() 函数查找与指定模式匹配的 CSV 文件的文件路径名,并将其存储在一个列表 csv_files 中。接着,我们使用 for 循环遍历该列表,读取 CSV 文件并将其存储在一个临时数据框 temp_df 中。每次遍历时,我们使用 pandas.concat() 函数将临时数据框 temp_df 合并到空数据框 df 中。最后,我们输出合并后的数据框 df。

以上就是如何将多个 CSV 文件合并到一个 Pandas 数据框中的方法。