创建 Pandas 系列数据的均值和标准差(1) - 芒果文档

📌 相关文章

📜 创建 Pandas 系列数据的均值和标准差(1)

📅 最后修改于: 2023-12-03 15:22:40.127000 🧑 作者: Mango

创建 Pandas 系列数据的均值和标准差

Pandas 是一种基于 Numpy 的库，用于数据处理和分析。Pandas 提供了 Series 和 DataFrame 两种数据结构，Series 是一种类似于数组的一维对象，它可以存储不同类型的数据，而 DataFrame 是由多个 Series 组成的表格型数据结构。本文将介绍如何使用 Pandas 创建 Series 数据，并计算均值和标准差。

创建 Pandas Series 数据

首先，我们需要导入 Pandas 库：

import pandas as pd

使用 Pandas 的 Series 函数来创建一个 Series 对象。其中，列表中的数据为 Series 中的数据，而 index 参数为 Series 中的数据索引，索引可以是数字或者字符串。

s = pd.Series([1,3,5,np.nan,6,8], index=['a','b','c','d','e','f'])

这里创建了一个 Series 对象，如下所示：

a     1.0
b     3.0
c     5.0
d     NaN
e     6.0
f     8.0
dtype: float64

计算均值和标准差

使用 Pandas 提供的 mean() 和 std() 函数分别可以计算 Series 数据的均值和标准差。示例代码如下：

mean = s.mean()
std = s.std()
print('Mean:', mean)
print('Standard Deviation:', std)

输出结果如下：

Mean: 4.6
Standard Deviation: 2.8577380332470415

可以看到，DataFrame 中的 mean() 函数和 std() 函数已经可以直接计算出均值和标准差。如果数据中有缺失值，则 mean() 和 std() 函数会自动忽略这些值。

以上就是创建 Pandas Series 数据并计算均值和标准差的方法，Pandas 还提供了更多常用的数据处理和分析功能，欢迎继续学习和探索。