Python 数值比较中的容差设计

2次阅读

浮点数直接用 == 比较总出错,因二进制无法精确表示多数十进制小数(如0.1+0.2=0.30000000000000004),导致内存值不等;应改用 math.isclose() 或 abs(a-b)

Python 数值比较中的容差设计

浮点数直接用 == 比较为什么总出错

因为二进制无法精确表示大多数十进制小数,0.1 + 0.2 实际结果是 0.30000000000000004,和 0.3 的内存表示不一致,所以 == 返回 False。这不是 python 独有,所有遵循 IEEE 754 的语言都这样。

常见错误现象:单元测试里 assert result == 0.3 偶尔失败;科学计算中判断“是否收敛”卡在临界值。

  • 永远别用 == 判断两个浮点数是否“数学上相等”
  • 改用 math.isclose()(Python 3.5+),它默认用相对容差 1e-09 和绝对容差 1e-09 双重判断
  • 如果要兼容旧版本,手动写 abs(a - b)

math.isclose() 的 rel_tol 和 abs_tol 怎么选

rel_tol 控制相对误差比例,适合比较数量级接近的数;abs_tol 是硬性阈值,对极小值(比如接近 0)必须设,否则 rel_tol 在分母趋近 0 时会失效。

使用场景举例:物理仿真中判断速度是否“基本为零”,或机器学习里检查梯度是否收敛到 1e-8 量级。

  • 一般数值计算,设 rel_tol=1e-09 足够(IEEE 754 double 精度约 15–17 位有效数字)
  • 涉及接近 0 的值,必须显式给 abs_tol,比如 math.isclose(x, 0.0, abs_tol=1e-12)
  • 不要把 rel_tol 设成 0——那会退化成纯绝对误差判断,但失去对大数的鲁棒性

numpy.allclose() 和 math.isclose() 的关键区别

numpy.allclose() 是数组批量比较,底层逻辑类似 math.isclose(),但默认容差更宽松:rtol=1e-05, atol=1e-08。直接混用容易漏掉精度问题。

性能影响:对单个数,math.isclose() 更轻量;对数组,必须用 numpy.allclose(),否则循环调用 math.isclose() 会慢一个数量级。

  • 数组比较一律用 numpy.allclose(),别自己写 np.array([math.isclose(a, b) for a, b in zip(arr1, arr2)]).all()
  • 若需和 math.isclose() 行为一致,显式传参:numpy.allclose(a, b, rtol=1e-09, atol=1e-09)
  • numpy.allclose()nan 默认返回 False,如需 “NaN == NaN”,加参数 equal_nan=True

自定义容差函数要注意的边界情况

手写容差比较看似简单,但容易忽略负数、无穷、NaN 和零除。比如 abs(a - b) 在 <code>abinf 时会得到 nan,导致判断失效。

真实项目里,容差逻辑常被封装进工具函数,但很多人只测了普通正数。

  • 必须单独处理 math.isinf()math.isnan():无穷大之间可比,但无穷和有限数不可比;NaN 一律视为不相等(除非明确要求)
  • 避免用 max(abs(a), abs(b)) 当分母——当两者都为 0 时没问题,但一正一负且绝对值相等时,max 仍为正,逻辑无误;真正危险的是两者都为 inf
  • 如果业务要求“误差不超过 0.01 元”,就用绝对容差 abs_tol=0.01,别强行套相对容差

容差不是越小越好,也不是统一设成 1e-9 就万事大吉。关键是根据数据量级、业务语义和误差来源决定该用相对、绝对,还是混合策略。最常被忽略的,是忘记给接近零的值配 abs_tol

text=ZqhQzanResources