📜  groupby 和 sort python (1)

📅  最后修改于: 2023-12-03 15:31:04.721000             🧑  作者: Mango

Groupby 和 Sort:Python中数据分组和排序

在Python中,数据分组和排序是数据分析中的两个基本操作。这两个操作可以在列表、数组、数据框等数据结构中使用。Python中提供了多种方法进行数据分组和排序,本文将着重介绍如何使用groupby和sort方法实现这两个操作。

Groupby(分组)

groupby是Python中对数据进行分组处理的一个重要方法。使用groupby方法,可以将数据按指定的列分组。接下来是示例代码:

import pandas as pd

# 读入数据
data = pd.read_excel('data.xlsx')

# 按照“学校”这一列进行分组
grouped = data.groupby('学校')

# 查看每个组的数据
for name, group in grouped:
    print(name)
    print(group)
    print('-----------------------------')

上述代码中,使用pandas库的read_excel方法读入一个Excel文件,然后使用groupby方法按照“学校”这一列进行分组。接下来,使用for循环遍历每个组,输出组的名称和数据。代码输出如下:

清华大学
     学校        专业  学生人数
0  清华大学  计算机科学   100
1  清华大学     人工智能    80
-----------------------------
北京大学
     学校   专业  学生人数
2  北京大学   数学    70
3  北京大学  物理学    60
-----------------------------

从输出结果可以看出,groupby方法已经将数据成功按照“学校”这一列分组,并且每个组的数据已经被分别输出。

Sort(排序)

sort是Python中对数据进行排序的方法。sort方法可以对列表、数组、数据框等数据结构中的数据进行排序。排序可以按照升序或降序进行,也可以根据指定的列进行排序。接下来是示例代码:

import pandas as pd

# 读入数据
data = pd.read_excel('data.xlsx')

# 根据"学生人数"这一列降序排序
sorted_data = data.sort_values('学生人数', ascending=False)

# 输出排序后的数据
print(sorted_data)

上述代码中,使用pandas库的read_excel方法读入一个Excel文件,然后使用sort_values方法按照“学生人数”这一列降序排序。最后,使用print函数输出排序后的数据。代码输出如下:

     学校        专业  学生人数
0  清华大学  计算机科学   100
2  北京大学        数学    70
1  清华大学     人工智能    80
3  北京大学       物理学    60

从输出结果可以看出,sort方法已经将数据成功按照“学生人数”这一列降序排序,并且排序后的数据也被输出。