Python|熊猫系列.describe()
Pandas 系列是带有轴标签的一维 ndarray。标签不必是唯一的,但必须是可散列的类型。该对象支持基于整数和基于标签的索引,并提供了许多用于执行涉及索引的操作的方法。
Pandas Series.describe()
函数生成描述性统计数据,总结给定系列对象的数据集分布的集中趋势、离散度和形状。所有计算都是通过排除 NaN 值来执行的。
Syntax: Series.describe(percentiles=None, include=None, exclude=None)
Parameter :
percentiles : The percentiles to include in the output.
include : A white list of data types to include in the result. Ignored for Series.
exclude : A black list of data types to omit from the result. Ignored for Series
Returns : Summary statistics of the Series
示例 #1:使用Series.describe()
函数查找给定系列对象的摘要统计信息。
# importing pandas as pd
import pandas as pd
# Creating the Series
sr = pd.Series([80, 25, 3, 25, 24, 6])
# Create the Index
index_ = ['Coca Cola', 'Sprite', 'Coke', 'Fanta', 'Dew', 'ThumbsUp']
# set the index
sr.index = index_
# Print the series
print(sr)
输出 :
现在我们将使用Series.describe()
函数来查找给定系列对象中基础数据的汇总统计信息。
# find summary statistics of the underlying
# data in the given series object.
result = sr.describe()
# Print the result
print(result)
输出 :
正如我们在输出中看到的, Series.describe()
函数已成功返回给定系列对象的摘要统计信息。示例 #2:使用Series.describe()
函数查找给定系列对象中基础数据的汇总统计信息。给定的系列对象包含一些缺失值。
# importing pandas as pd
import pandas as pd
# Creating the Series
sr = pd.Series([100, None, None, 18, 65, None, 32, 10, 5, 24, None])
# Create the Index
index_ = pd.date_range('2010-10-09', periods = 11, freq ='M')
# set the index
sr.index = index_
# Print the series
print(sr)
输出 :
现在我们将使用Series.describe()
函数来查找给定系列对象中基础数据的汇总统计信息。
# find summary statistics of the underlying
# data in the given series object.
result = sr.describe()
# Print the result
print(result)
输出 :
正如我们在输出中看到的, Series.describe()
函数已成功返回给定系列对象的摘要统计信息。在计算这些统计值时,已忽略NaN
值。