📜  df .sort_values - Python (1)

📅  最后修改于: 2023-12-03 15:30:26.794000             🧑  作者: Mango

df.sort_values - Python

df.sort_values()是pandas库中的一个DataFrame函数,用于根据指定列或标签排序数据框中的行。

语法
df.sort_values(by, axis=0, ascending=True, inplace=False, na_position='last', ignore_index=False, key=None)
参数
  • by : str or list of str
    • 用于排序的列或标签。
  • axis : {0 or 'index', 1 or 'columns'}, default 0
    • 排序的轴,0按行,1按列,默认是按行。
  • ascending : bool or list of bool, default True
    • 升序或降序,默认升序。
  • inplace : bool, default False
    • 是否在原地排序,如果为True,则更改原始DataFrame。
  • na_position : {'last', 'first'}, default 'last'
    • 定义缺失值的位置是否在排序结果的最后面或前面。
  • ignore_index : bool, default False
    • 是否忽略原始索引并返回新的索引。
  • key : callable, default None
    • 用于确定排序值的函数。
返回值
  • DataFrame
    • 排序后的数据框。
示例

下面的代码演示如何使用df.sort_values()函数对数据框进行排序。

import pandas as pd

# 创建数据框
data = {'name': ['Amy', 'Bob', 'Cathy', 'David', 'Emily'],
        'age': [24, 23, 25, 22, 21],
        'gender': ['F', 'M', 'F', 'M', 'F']}
df = pd.DataFrame(data)

# 按 age 列升序排序
df.sort_values(by='age', inplace=True)
print(df)

# 按 name 列降序排序,缺失值放前面
df.sort_values(by='name', ascending=False, na_position='first', inplace=True)
print(df)

输出:

   name  age gender
3  David   22      M
4  Emily   21      F
1    Bob   23      M
0    Amy   24      F
2  Cathy   25      F

    name  age gender
4  Emily   21      F
3  David   22      M
1    Bob   23      M
0    Amy   24      F
2  Cathy   25      F

可以看到,第一个排序是按age升序排序,第二个排序是按name降序排序并将缺失值放在前面。

总之,df.sort_values()函数是一个方便快捷的排序工具,可以帮助Python程序员更轻松地处理数据框的排序问题。