Python 中实现任意散点数据的双线性最小二乘拟合教程

11次阅读

本文介绍如何对非网格、不规则分布的二维输入（x, y）与输出（z）数据，使用最小二乘法拟合双线性模型 z = a·x + b·y + c·x·y + d，并准确求解系数 a、b、c、d。方法纯 numpy 实现，无需网格化或插值，适用于缺失值、不等采样密度的真实实验数据。

双线性拟合本质上是带交叉项的线性回归：虽然模型在 x 和 y 上是非线性的（含乘积项 x·y），但关于待估参数 a、b、c、d 是线性的。因此，可直接套用多元线性最小二乘法——即最小化残差平方和
$$ S = sum_{i=1}^N left( a x_i + b y_i + c x_i y_i + d – z_i right)^2 $$
对 a、b、c、d 分别求偏导并令其为 0，可导出标准的正规方程组（Normal Equations）： $$ mathbf{A} cdot begin{bmatrix}a b c dend{bmatrix} = mathbf{b} $$ 其中设计矩阵 $mathbf{A}$ 和右侧向量 $mathbf{b}$ 的元素由数据的各阶统计量构成（如 $sum x_i$, $sum x_i y_i$, $sum x_i y_i z_i$ 等）。

以下是一个高效、可复用的 bilinear_fit 函数实现，完全基于 NumPy，无外部依赖：

import numpy as np  def bilinear_fit(data):     """     对散点数据 (x, y, z) 进行双线性最小二乘拟合：z = a*x + b*y + c*x*y + d      Parameters:     -----------     data : list of [x, y, z] or ndarray of shape (N, 3)         输入数据点集合，支持任意数量、非均匀、非网格分布      Returns:     --------     tuple: (a, b, c, d) 拟合系数     """     data = np.asarray(data)     x, y, z = data[:, 0], data[:, 1], data[:, 2]     N = len(x)      # 计算必要统计量（避免循环，更高效）     Sx   = np.sum(x)     Sxx  = np.sum(x * x)     Sy   = np.sum(y)     Syy  = np.sum(y * y)     Sxy  = np.sum(x * y)     Sxxy = np.sum(x * x * y)     Sxyy = np.sum(x * y * y)     Sxxyy = np.sum(x * x * y * y)     Sz   = np.sum(z)     Sxz  = np.sum(x * z)     Syz  = np.sum(y * z)     Sxyz = np.sum(x * y * z)      # 构建正规方程组 A @ [a,b,c,d] = RHS     A = np.array([         [Sxx,  Sxy,  Sxxy, Sx ],         [Sxy,  Syy,  Sxyy, Sy ],         [Sxxy, Sxyy, Sxxyy, Sxy],         [Sx,   Sy,   Sxy,  N  ]     ])     RHS = np.array([Sxz, Syz, Sxyz, Sz])      try:         coeffs = np.linalg.solve(A, RHS)         return coeffs[0], coeffs[1], coeffs[2], coeffs[3]     except np.linalg.LinAlgError as e:         raise ValueError("正规方程组矩阵奇异，请检查数据是否共线（如 x 或 y 全为常数）或样本量不足（N < 4）") from e  # 示例：使用用户提供的真实数据 D = [     [1056,   8,   50.89124679], [1056,  16,  61.62827273], [1056,  32,  78.83079982],     [1056,  48,  92.90073197], [1056,  64, 105.103744 ], [1056,  80, 116.0303753],     [1056,  96, 126.0130906], [1056, 112, 135.2610439], [1056, 128, 143.9159512],     [1056, 144, 152.0790946], [2048,   8,  63.71675604], [2048,  16,  77.15971099],     [2048,  32,  98.69757849], [2048,  48, 116.313387 ], [2048,  64, 131.5917779],     [2048,  80, 145.2721136], [2048,  96, 157.7706532], [2048, 112, 169.3492575],     [2048, 128, 180.1853546], [2048, 144, 190.4057615], [4096,   8,  86.7357654 ],     [4096,  16, 105.0352703], [4096,  32, 134.3541477], [4096,  48, 158.334033 ],     [4096,  64, 179.1320602], [4096,  80, 197.7547066], [4096,  96, 214.7686034],     [4096, 112, 230.5302193], [4096, 128, 245.2810877], [4096, 144, 259.193829 ] ]  a, b, c, d = bilinear_fit(D) print(f"拟合结果：") print(f"a (x 系数) = {a:.10f}") print(f"b (y 系数) = {b:.10f}") print(f"c (xy 交叉项) = {c:.10f}") print(f"d (截距) = {d:.10f}")  # 验证拟合效果 z_pred = a * np.array(D)[:,0] + b * np.array(D)[:,1] + c * np.array(D)[:,0] * np.array(D)[:,1] + d residuals = z_pred - np.array(D)[:,2] print(f"nR² 决定系数 = {1 - np.sum(residuals**2) / np.sum((np.array(D)[:,2] - np.mean(D, axis=0)[2])**2):.4f}")

✅ 关键优势说明：

✅ 完全适配散点数据：不要求 x-y 构成矩形网格，允许任意分布、缺失点、重复 x/y 值；
✅ 解析解、高精度：通过正规方程直接求解，比迭代法更稳定、更快；
✅ 可解释性强：返回明确物理意义的系数 a, b, c, d，便于后续分析或嵌入公式；
✅ 轻量可靠：仅依赖 NumPy，无 sklearn/scipy 插值器的黑盒限制（如无法导出系数、边界外推异常等）。

⚠️ 注意事项：

数据量应 ≥ 4（参数个数），否则方程组欠定；
若 x 或 y 列全为常数（如所有 y=8），会导致设计矩阵秩亏，需预处理或改用正则化（如 np.linalg.lstsq 加 rcond）；
对强非线性或存在显著离群点的数据，建议先做标准化（如 (x - x_mean)/x_std）以提升数值稳定性；
如需不确定性评估（如系数标准误），可进一步计算协方差矩阵 $(mathbf{X}^top mathbf{X})^{-1} sigma^2$，其中 $mathbf{X}$ 为设计矩阵 $[x_i,, y_i,, x_i y_i,, 1]$。

该方法已在多个工程场景（如传感器响应建模、GPU性能预测、图像几何校正）中验证有效，是处理双线性关系最直接、透明且可控的解决方案。

立即学习“Python免费学习笔记（深入）”；

发表于：运维

2026-01-18

# ai # numpy # python # red # scipy # sklearn # yy # 传感器 # 线性回归

复制链接

html5怎么跨平台保持样式一致_多端适配操作【操作】

LinuxDNS解析慢怎么办_缓存与配置优化解析【技巧】

css 想让多列文本等高怎么办_flexbox align-items stretch 配合

mysql执行SQL如何保证事务一致性_mysql执行机制解析

币安交易所官网怎么访问币安binance交易平台官网入口及App下载

Python 中实现任意散点数据的双线性最小二乘拟合教程

欧易OKX交易所APP官方下载_欧易最新版v6.191.0安卓iOS通用安装教程

如何搭建mysql沙箱环境_mysql测试隔离方案

Go 项目中实现可复用、团队友好的导入路径管理方案

javascript中如何进行条件判断？_if语句和switch语句该如何选择？【教程】

mysql中的索引选择性与查询效率分析

Sublime怎么恢复未保存的文件_Sublime崩溃后数据找回方法【建议收藏】

PHP怎样判断文件是否存在_PHP判断文件存在方法【检测】

HTML5不同版本跳转写法有何差异_HTML5与HTML4跳转对比【详解】

Laravel怎么做前端组件化_Laravel集成Livewire免写JS代码【必备】

Composer如何自定义命令行别名_简化Composer常用操作指令【方法】