Python 数值比较中的容差设计

2次阅读

浮点数直接用 == 比较总出错，因二进制无法精确表示多数十进制小数（如0.1+0.2=0.30000000000000004），导致内存值不等；应改用 math.isclose() 或 abs(a-b)
浮点数直接用 == 比较为什么总出错
因为二进制无法精确表示大多数十进制小数，0.1 + 0.2 实际结果是 0.30000000000000004，和 0.3 的内存表示不一致，所以 == 返回 False。这不是 python 独有，所有遵循 IEEE 754 的语言都这样。
常见错误现象：单元测试里 assert result == 0.3 偶尔失败；科学计算中判断“是否收敛”卡在临界值。
永远别用 == 判断两个浮点数是否“数学上相等”
改用 math.isclose()（Python 3.5+），它默认用相对容差 1e-09 和绝对容差 1e-09 双重判断
如果要兼容旧版本，手动写 abs(a - b)
math.isclose() 的 rel_tol 和 abs_tol 怎么选
rel_tol 控制相对误差比例，适合比较数量级接近的数；abs_tol 是硬性阈值，对极小值（比如接近 0）必须设，否则 rel_tol 在分母趋近 0 时会失效。
使用场景举例：物理仿真中判断速度是否“基本为零”，或机器学习里检查梯度是否收敛到 1e-8 量级。
一般数值计算，设 rel_tol=1e-09 足够（IEEE 754 double 精度约 15–17 位有效数字）
涉及接近 0 的值，必须显式给 abs_tol，比如 math.isclose(x, 0.0, abs_tol=1e-12)
不要把 rel_tol 设成 0——那会退化成纯绝对误差判断，但失去对大数的鲁棒性
numpy.allclose() 和 math.isclose() 的关键区别
numpy.allclose() 是数组批量比较，底层逻辑类似 math.isclose()，但默认容差更宽松：rtol=1e-05, atol=1e-08。直接混用容易漏掉精度问题。
性能影响：对单个数，math.isclose() 更轻量；对数组，必须用 numpy.allclose()，否则循环调用 math.isclose() 会慢一个数量级。
数组比较一律用 numpy.allclose()，别自己写 np.array([math.isclose(a, b) for a, b in zip(arr1, arr2)]).all()
若需和 math.isclose() 行为一致，显式传参：numpy.allclose(a, b, rtol=1e-09, atol=1e-09)
numpy.allclose() 对 nan 默认返回 False，如需 “NaN == NaN”，加参数 equal_nan=True
自定义容差函数要注意的边界情况
手写容差比较看似简单，但容易忽略负数、无穷、NaN 和零除。比如 abs(a - b) 在 <code>a 或 b 是 inf 时会得到 nan，导致判断失效。
真实项目里，容差逻辑常被封装进工具函数，但很多人只测了普通正数。
必须单独处理 math.isinf() 和 math.isnan()：无穷大之间可比，但无穷和有限数不可比；NaN 一律视为不相等（除非明确要求）
避免用 max(abs(a), abs(b)) 当分母——当两者都为 0 时没问题，但一正一负且绝对值相等时，max 仍为正，逻辑无误；真正危险的是两者都为 inf
如果业务要求“误差不超过 0.01 元”，就用绝对容差 abs_tol=0.01，别强行套相对容差
容差不是越小越好，也不是统一设成 1e-9 就万事大吉。关键是根据数据量级、业务语义和误差来源决定该用相对、绝对，还是混合策略。最常被忽略的，是忘记给接近零的值配 abs_tol。