Python|熊猫 dataframe.std()
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas dataframe.std()
函数返回请求轴上的样本标准偏差。默认情况下,标准偏差由 N-1 标准化。它是一种用于量化一组数据值的变化或分散量的度量。欲了解更多信息,请点击此处
Syntax : DataFrame.std(axis=None, skipna=None, level=None, ddof=1, numeric_only=None, **kwargs)
Parameters :
axis : {index (0), columns (1)}
skipna : Exclude NA/null values. If an entire row/column is NA, the result will be NA
level : If the axis is a MultiIndex (hierarchical), count along a particular level, collapsing into a Series
ddof : Delta Degrees of Freedom. The divisor used in calculations is N – ddof, where N represents the number of elements.
numeric_only : Include only float, int, boolean columns. If None, will attempt to use everything, then use only numeric data. Not implemented for Series.
Return : std : Series or DataFrame (if level specified)
有关代码中使用的 CSV 文件的链接,请单击此处
示例 #1:使用std()
函数沿索引轴查找数据的标准差。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Print the dataframe
df
现在找到数据框中所有数字列的标准差。我们将在计算标准差时跳过NaN
值。
# finding STD
df.std(axis = 0, skipna = True)
输出 :
示例 #2:使用std()
函数查找列轴上的标准差。
沿柱轴求标准差。我们将设置skipna为真。如果我们不跳过NaN
值,那么它将导致NaN
值。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# STD over the column axis.
df.std(axis = 1, skipna = True)
输出 :