📅  最后修改于: 2023-12-03 15:18:13.735000             🧑  作者: Mango
在使用Python的pandas库进行数据分析时,常常需要获取数据的一些基本统计信息,例如均值、最小值和最大值。Pandas提供了describe
函数和一些其他函数用于获取这些信息。
describe
函数describe
函数用于获取数据的基本统计信息,包括计数、均值、标准差、最小值、最大值和一些分位数。其语法如下:
df.describe()
其中,df是一个Pandas数据帧。describe函数返回一个新的数据帧,其中包含上述统计信息。例如:
import pandas as pd
data = {
'A': [1, 2, 3, 4, 5],
'B': [2, 4, 6, 8, 10],
'C': [3, 6, 9, 12, 15]
}
df = pd.DataFrame(data)
print(df.describe())
输出如下:
A B C
count 5.000000 5.000000 5.000000
mean 3.000000 6.000000 9.000000
std 1.581139 3.162278 4.743416
min 1.000000 2.000000 3.000000
25% 2.000000 4.000000 6.000000
50% 3.000000 6.000000 9.000000
75% 4.000000 8.000000 12.000000
max 5.000000 10.000000 15.000000
从输出结果可以看出,数据帧中每个列的均值、最小值、最大值、标准差和分位数都被输出了。
除了describe
函数外,Pandas还提供了mean
、min
和max
函数用于获取数据帧中每个列的均值、最小值和最大值。其语法如下:
df.mean()
df.min()
df.max()
这些函数返回一个新的数据帧,其中包含对应的均值、最小值和最大值。例如:
import pandas as pd
data = {
'A': [1, 2, 3, 4, 5],
'B': [2, 4, 6, 8, 10],
'C': [3, 6, 9, 12, 15]
}
df = pd.DataFrame(data)
print(df.mean())
print(df.min())
print(df.max())
输出如下:
A 3.0
B 6.0
C 9.0
dtype: float64
A 1
B 2
C 3
dtype: int64
A 5
B 10
C 15
dtype: int64
从输出结果可以看出,每个函数返回了一个数据帧,其中包含每个列的均值、最小值和最大值。