📅  最后修改于: 2023-12-03 15:38:45.422000             🧑  作者: Mango
如果你需要将多个 CSV 文件中的数据合并到一个 Pandas 数据框中,可以使用 pandas.concat() 函数来实现。
可以使用 pandas.read_csv() 函数来加载一个 CSV 文件,并使用 pandas.concat() 函数将多个数据框合并到一个数据框中。对于要合并的数据框,可以将其存储在一个列表中,并将该列表传递给 pandas.concat() 函数:
import pandas as pd
# 创建一个空的数据框
df = pd.DataFrame()
# 待合并数据框的文件名列表
file_names = ['file1.csv', 'file2.csv', 'file3.csv']
# 遍历文件名列表,读取 CSV 文件,并将其合并到一个数据框中
for file in file_names:
temp_df = pd.read_csv(file)
df = pd.concat([df, temp_df], ignore_index=True)
# 输出合并后的数据框
print(df)
在上面的代码中,我们首先创建了一个空的数据框 df。然后,我们定义了待合并数据框的文件名列表 file_names。接着,我们使用 for 循环遍历该列表,读取 CSV 文件并将其存储在一个临时数据框 temp_df 中。每次遍历时,我们使用 pandas.concat() 函数将临时数据框 temp_df 合并到空数据框 df 中。最后,我们输出合并后的数据框 df。
另一种常用的方法是使用 glob 模块来加载 CSV 文件,并使用 pandas.concat() 函数将它们合并到一个数据框中。glob 模块提供了一个函数,用于查找与指定模式匹配的文件路径名。我们可以使用该函数来查找所有要合并的 CSV 文件的文件路径名,并将其存储在一个列表中。接着,我们使用 for 循环遍历该列表,读取 CSV 文件并将其存储在一个临时数据框 temp_df 中。每次遍历时,我们使用 pandas.concat() 函数将临时数据框 temp_df 合并到空数据框 df 中。最后,我们输出合并后的数据框 df。
import pandas as pd
import glob
# 创建一个空的数据框
df = pd.DataFrame()
# 查找所有要合并的 CSV 文件的文件路径名,并将其存储在一个列表中
csv_files = glob.glob('*.csv')
# 遍历 CSV 文件列表,读取每个 CSV 文件,并将其合并到一个数据框中
for file in csv_files:
temp_df = pd.read_csv(file)
df = pd.concat([df, temp_df], ignore_index=True)
# 输出合并后的数据框
print(df)
在上面的代码中,我们首先创建了一个空的数据框 df。然后,我们使用 glob.glob() 函数查找与指定模式匹配的 CSV 文件的文件路径名,并将其存储在一个列表 csv_files 中。接着,我们使用 for 循环遍历该列表,读取 CSV 文件并将其存储在一个临时数据框 temp_df 中。每次遍历时,我们使用 pandas.concat() 函数将临时数据框 temp_df 合并到空数据框 df 中。最后,我们输出合并后的数据框 df。
以上就是如何将多个 CSV 文件合并到一个 Pandas 数据框中的方法。