📅  最后修改于: 2023-12-03 15:33:24.590000             🧑  作者: Mango
在数据科学中,经常需要对数据框进行排序以便更有效地分析数据, Pandas 提供了多种按列排序的方法。
本文将介绍 Pandas 数据框按列排序的常见方法,包括单个列排序和多列排序。
对于单个列排序,可以使用 sort_values
方法。下面是一个例子:
import pandas as pd
# 创建数据框
data = {'name': ['Tom', 'Jack', 'Steve', 'Ricky', 'Tom'],
'age': [28, 34, 29, 42, 19],
'gender': ['M', 'M', 'M', 'M', 'M']}
df = pd.DataFrame(data)
# 按年龄升序排序
df = df.sort_values(by=['age'], ascending=True)
# 打印结果
print(df)
输出结果为:
name age gender
4 Tom 19 M
0 Tom 28 M
2 Steve 29 M
1 Jack 34 M
3 Ricky 42 M
可以看到,数据框被按年龄升序排序了。
对于多列排序,可以在调用 sort_values
方法时传递一个列表,列表中包含需要排序的多个列名。下面是一个例子:
import pandas as pd
# 创建数据框
data = {'name': ['Tom', 'Jack', 'Steve', 'Ricky', 'Tom'],
'age': [28, 34, 29, 42, 19],
'gender': ['M', 'M', 'M', 'M', 'M']}
df = pd.DataFrame(data)
# 按年龄升序、按名字降序排序
df = df.sort_values(by=['age', 'name'], ascending=[True, False])
# 打印结果
print(df)
输出结果为:
name age gender
4 Tom 19 M
0 Tom 28 M
2 Steve 29 M
1 Jack 34 M
3 Ricky 42 M
可以看到,数据框被按年龄升序、按名字降序排序了。
总而言之, Pandas 提供了多种按列排序的方法来方便我们对数据框进行快速排序,适合于数据科学中对数据进行多方位分析的需求。