📅  最后修改于: 2023-12-03 15:37:09.859000             🧑  作者: Mango
在数据分析中,我们可能需要将两个或多个列合并成一个列。在Python中,我们使用pandas库来处理数据,pandas库提供了许多函数来合并列。本文将介绍如何使用pandas库来合并df列python。
本文中使用的示例数据集为iris数据集,iris数据集包含四个特征,分别为花萼长度、花萼宽度、花瓣长度和花瓣宽度,以及一个类别列,表示鸢尾花的类别。我们将使用pandas库来合并花萼长度和花萼宽度两列,生成一个新列,表示花萼面积。
import pandas as pd
from sklearn.datasets import load_iris
# 导入iris数据集
iris = load_iris()
# 创建df
df = pd.DataFrame(iris.data, columns=iris.feature_names)
# 合并花萼长度和花萼宽度两列
df['sepal_area'] = df['sepal length (cm)'] * df['sepal width (cm)']
import pandas as pd
from sklearn.datasets import load_iris
# 导入iris数据集
iris = load_iris()
# 创建df
df = pd.DataFrame(iris.data, columns=iris.feature_names)
# 合并花萼长度和花萼宽度两列
df['sepal_area'] = df['sepal length (cm)'] * df['sepal width (cm)']
以上代码将合并iris数据集中的花萼长度和花萼宽度两列,生成一个新列,表示花萼面积。在实际的数据分析中,我们可以使用类似的方法来合并数据集中的多个列,生成一个新列。