📅  最后修改于: 2023-12-03 15:33:24.166000             🧑  作者: Mango
在数据分析和清洗中,经常需要根据数据集中已有的列来创建新的列。Pandas 提供了很多方法来实现这一目的。本文将介绍如何使用 Pandas 从另一列创建列。
我们首先需要导入 Pandas 模块:
import pandas as pd
如果我们要从单个列创建新列,可以使用 apply
方法,该方法接受一个函数作为参数,该函数会对列中的每个值进行操作并返回新的值。
下面是一个示例,我们将 df
数据框中的 A
列乘以 2 并将结果存储在新列 B
中:
df = pd.DataFrame({'A': [1, 2, 3, 4, 5]})
df['B'] = df['A'].apply(lambda x: x * 2)
print(df)
输出结果如下:
A B
0 1 2
1 2 4
2 3 6
3 4 8
4 5 10
如果我们要从多个列创建新列,可以使用 apply
方法并传递一个函数,该函数接受整个行作为参数并返回新的值。
下面是一个示例,我们将 df
数据框中的 A
列和 B
列相加并将结果存储在新列 C
中:
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]})
df['C'] = df.apply(lambda x: x['A'] + x['B'], axis=1)
print(df)
输出结果如下:
A B C
0 1 6 7
1 2 7 9
2 3 8 11
3 4 9 13
4 5 10 15
本文介绍了如何使用 Pandas 从另一列创建列。我们通过使用 apply
方法并传递一个函数来实现从单个列和多个列创建新列的操作。此外,还介绍了如何在函数中访问行数据。
Pandas 提供了很多强大的函数和工具,可以让数据探索和清洗变得更加简单和高效。如果您想深入了解 Pandas,请查阅官方文档。