📅  最后修改于: 2023-12-03 15:08:45.260000             🧑  作者: Mango
在数据科学和数据分析领域中,Pandas 是一种非常常见的 Python 库,它提供了统计分析和数据操作的工具。Pandas 中包含两个重要的数据结构:Series 和 DataFrame。在对数据进行分析和处理时,我们可能需要将多个 DataFrame 连接起来,同时在数据中添加标题,以便更好地理解数据。
本文将介绍如何使用 Pandas 中的 concat() 函数在 Python 中连接多个 DataFrame,并为每个 DataFrame 添加标题。以下是详细的步骤:
在 Python 中打开 Jupyter Notebook,并在第一个单元格中导入 Pandas 库。
import pandas as pd
在此步骤中,我们将创建两个包含不同数据的 DataFrame。
df1 = pd.DataFrame({'id': [1, 2, 3, 4], 'Name': ['John', 'Sam', 'Julia', 'Kim'], 'Age': [20, 25, 30, 35]})
df2 = pd.DataFrame({'id': [5, 6, 7, 8], 'Name': ['Bill', 'David', 'Anne', 'Lisa'], 'Age': [40, 45, 50, 55]})
使用 Pandas 中的 concat() 函数将 DataFrame 连接在一起。
df_combined = pd.concat([df1, df2], axis = 0)
为每个 DataFrame 添加标题,以便更好地理解数据。我们可以使用 Pandas 中的 DataFrame.rename() 函数来更改 DataFrame 的列名。
df1 = df1.rename(columns = {'id': 'Customer ID', 'Name': 'Customer Name', 'Age': 'Customer Age'})
df2 = df2.rename(columns = {'id': 'Customer ID', 'Name': 'Customer Name', 'Age': 'Customer Age'})
最后,将连接的 DataFrame 保存为 CSV 文件。我们可以使用 Pandas 中的 DataFrame.to_csv() 函数将 DataFrame 保存为 CSV 文件。
df_combined.to_csv('combined_data.csv', index = False)
完整代码如下:
import pandas as pd
# Create DataFrame 1
df1 = pd.DataFrame({'id': [1, 2, 3, 4], 'Name': ['John', 'Sam', 'Julia', 'Kim'], 'Age': [20, 25, 30, 35]})
# Create DataFrame 2
df2 = pd.DataFrame({'id': [5, 6, 7, 8], 'Name': ['Bill', 'David', 'Anne', 'Lisa'], 'Age': [40, 45, 50, 55]})
# Combine the DataFrames
df_combined = pd.concat([df1, df2], axis = 0)
# Rename the columns of each DataFrame
df1 = df1.rename(columns = {'id': 'Customer ID', 'Name': 'Customer Name', 'Age': 'Customer Age'})
df2 = df2.rename(columns = {'id': 'Customer ID', 'Name': 'Customer Name', 'Age': 'Customer Age'})
# Save the combined DataFrame to a CSV file
df_combined.to_csv('combined_data.csv', index = False)
以上是使用 Pandas 连接后为每个数据帧添加标题的完整步骤。连接数据帧和重命名列导致代码更加明确,同时使数据更加可读和有意义。