📌  相关文章
📜  pandas 其他列的新列平均值 - Python (1)

📅  最后修改于: 2023-12-03 14:45:03.346000             🧑  作者: Mango

Pandas 其他列的新列平均值 - Python

Pandas是Python中非常强大的数据处理库之一,它提供了各种各样的方法,使得开发人员能够快速、高效地对数据进行分析、处理、清理和可视化等操作。

在本文中,我们将介绍如何使用Pandas在数据框中创建一个新列,该新列的值是其他列的平均值。

创建包含样本数据的数据框

首先,我们需要创建一个包含样本数据的数据框,这样我们才能对其进行分析和处理。在本文的示例中,我们将使用Pandas的DataFrame方法创建一个包含有关三个不同城市的数据框。

import pandas as pd

# 创建包含样本数据的数据框
data = {'城市': ['北京', '上海', '广州'],
        '人口': [2154.2, 2423.78, 1473.37],
        '面积': [16410, 6340.5, 7434.4]}
df = pd.DataFrame(data)
print(df)

上述示例代码创建一个包含三个城市的数据框,每个城市都有其人口数量和面积数据。

创建新列

接下来,我们将创建一个名为“平均人口密度”的新列,其值将是“人口”和“面积”列的平均值。具体方法是使用Pandas的apply方法,该方法可将自定义函数应用于指定的列,然后将结果添加为新列。

# 将 “人口”和“面积”列的平均值添加为新列
df['平均人口密度'] = df.apply(lambda row: (row['人口'] / row['面积']), axis=1)
print(df)

该示例代码将一个新的名为“平均人口密度”的列添加到数据框中,并使用apply方法将每行的“人口”和“面积”列的平均值计算出来并将其作为新列的值。

计算新列的平均值

最后,我们将使用Pandas的mean方法计算新列的平均值。

# 计算新列“平均人口密度”的平均值
average_density = df['平均人口密度'].mean()
print("平均人口密度: {}".format(average_density))

该示例代码将计算新列的平均值,并输出结果。

结论

在本文中,我们介绍了如何使用Pandas在数据框中创建一个新列,该新列的值是其他列的平均值。具体方法是使用apply方法将自定义函数应用于指定的列,并通过mean方法计算新列的平均值。这是Pandas中非常有用的一个功能,可以帮助开发人员进行快速、高效的数据分析和处理。