📅  最后修改于: 2023-12-03 15:09:51.933000             🧑  作者: Mango
在处理数据时,我们有时需要通过两个列的平均值来求得一列新的列。这里介绍如何使用Python Pandas库来实现这个功能。
假设我们有以下两个列(A和B):
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [3, 4, 5, 6]})
print(df)
输出:
A B
0 1 3
1 2 4
2 3 5
3 4 6
现在我们想要求得一列新的列,它的元素为A列和B列的平均值。我们可以使用如下代码:
df['C'] = (df['A'] + df['B']) / 2
print(df)
输出:
A B C
0 1 3 2.0
1 2 4 3.0
2 3 5 4.0
3 4 6 5.0
代码中的df['C'] = (df['A'] + df['B']) / 2
表示将A列和B列的值相加后除以2得到新的列C,并将其加入到数据框df中。
这里使用了Python中的运算符+
和/
,以及Pandas中的df['A']
和df['B']
来访问数据框df中的A列和B列。
通过Python Pandas库,我们可以轻松地得到一列对应于两列的平均值,而不用手动遍历这两列。这种方法大大简化了代码,提高了操作效率。