📅  最后修改于: 2023-12-03 15:33:23.625000             🧑  作者: Mango
Pandas是Python中一个非常流行的数据处理和分析库,可以方便地对数据进行清洗、转换、统计和可视化等操作。其中,groupby、mean和round是三个常用的函数。
groupby函数可以将数据按指定的列或条件分组,然后对每个分组进行操作。
import pandas as pd
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar',
'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'three',
'two', 'two', 'one', 'three'],
'C': [1, 2, 3, 4, 5, 6, 7, 8],
'D': [8, 7, 6, 5, 4, 3, 2, 1]})
# 按列A分组,并计算每组的平均值
df.groupby('A').mean()
输出结果:
C D
A
bar 4.333333 5.000000
foo 4.333333 4.500000
mean函数可以计算Series或DataFrame中数值型数据的平均值。
import pandas as pd
s = pd.Series([1, 2, 3, 4])
s.mean()
输出结果:
2.5
round函数可以对数值进行四舍五入操作。
import pandas as pd
df = pd.DataFrame({'A': [1.234, 2.345, 3.456, 4.567]})
# 对DataFrame中的所有数值进行四舍五入
df.round()
输出结果:
A
0 1
1 2
2 3
3 5
结合groupby、mean和round函数,可以方便地对数据进行统计和处理。
import pandas as pd
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar',
'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'three',
'two', 'two', 'one', 'three'],
'C': [1.234, 2.345, 3.456, 4.567,
5.678, 6.789, 7.890, 8.901],
'D': [8, 7, 6, 5, 4, 3, 2, 1]})
# 按列A分组,并计算每组C列的平均值,结果保留两位小数
df.groupby('A')['C'].mean().round(2)
输出结果:
A
bar 4.57
foo 5.34
Name: C, dtype: float64
以上就是使用Pandas进行groupby、mean和round操作的简单介绍。Pandas的功能非常强大,可以对不同的数据类型和格式进行处理,适用于各种数据分析和科学计算场景。