Python如何自定义比较规则_排序高级用法解析

3次阅读

Python如何自定义比较规则_排序高级用法解析

python 中自定义比较规则的核心在于控制排序时元素之间的大小判断逻辑,不依赖默认的 比较,而是通过函数或类明确告诉解释器“谁该排在前面”。关键不是重写比较操作符(除非用 <code>__lt__ 等魔术方法),而是用 key 参数或 functools.cmp_to_key 把原始数据映射为可比形式。

用 key 函数实现轻量级自定义排序

key 是最常用、最推荐的方式。它不改变原数据,只提供一个“提取/转换”的规则,让 sort 或 sorted 按照这个规则的返回值来排序。

  • 对字典列表按某个字段排序:
    students = [{'name': 'Alice', 'score': 85}, {'name': 'Bob', 'score': 92}]<br>students.sort(key=lambda x: x['score'], reverse=True)

  • 忽略大小写排序字符串
    names = ['Charlie', 'alice', 'Bob']<br>sorted(names, key=str.lower)

  • 多级排序(先按年龄升序,再按姓名降序):
    people = [('Alice', 30), ('Bob', 25), ('Charlie', 30)]<br>sorted(people, key=lambda x: (x[1], -ord(x[0][0])))  # 简单示例;更稳妥可用 str.lower 配合 tuple

用 cmp_to_key 处理复杂逻辑比较

当排序逻辑无法简单用 key 表达(比如需要访问相邻元素、有状态判断、或已有旧式比较函数),可用 functools.cmp_to_key 将传统“两参数比较函数”转为 key 可用的对象

  • 比较函数签名是 def compare(a, b) → int:返回负数(a 在 b 前)、零(相等)、正数(a 在 b 后)
  • 转换后传给 key= 即可:
    from functools import cmp_to_key<br><br>def by_length_then_alpha(a, b):<br>    if len(a) != len(b):<br>        return len(a) - len(b)<br>    return -1 if a < b else (1 if a > b else 0)<br><br>words = ['hi', 'hello', 'a', 'world']<br>sorted(words, key=cmp_to_key(by_length_then_alpha))  # → ['a', 'hi', 'hello', 'world']

在类中定义自然排序行为(__lt__ 等)

若希望某类实例默认就支持排序(如直接调用 sorted(my_objects)),可在类中实现富比较方法,最常用的是 __lt__less than)。

立即学习Python免费学习笔记(深入)”;

  • 只需实现 __lt__sorted() 就能工作(它只依赖
  • 例子:
    class Person:<br>    def __init__(self, name, age):<br>        self.name = name<br>        self.age = age<br>    def __lt__(self, other):<br>        return self.age < other.age  # 按年龄升序<br><br>people = [Person('Alice', 30), Person('Bob', 25)]<br>sorted(people)  # 自动按 age 排

  • 如需完整比较支持(==, !=, >, etc.),可用 @total_ordering 装饰器,只需定义 __lt____eq__

注意稳定性与性能取舍

Python 的 sortsorted 是稳定排序——相等元素的相对顺序不会改变。这点在多级排序中很有用(比如先按分数排,再按提交时间排,可保证同分者按时间先后不乱)。

  • key 方式高效且简洁,每次调用只计算一次键值(内部会缓存),适合大多数场景
  • cmp_to_key 会有额外函数调用开销,且比较次数更多(O(n log n) 次比较,每次调两个参数),仅在逻辑确实绕不开时使用
  • 避免在 key 函数里做耗时操作(如读文件、网络请求),否则严重拖慢排序速度

text=ZqhQzanResources