
本文介绍在 numpy 中根据输入向量维度(一维 `(3,)` 或二维 `(3, n)`)动态创建对应数量的 3×3 单位矩阵——即返回 `shape=(3,3)` 或 `(3,3,n)` 的数组,全程避免显式循环与冗余赋值,兼顾简洁性与计算效率。
在科学计算与物理模拟中,常需将标量操作推广至批量向量处理。例如,当函数接收一个形状为 (3,) 的三维向量或形状为 (3, n) 的 n 个向量时,内部可能需构造对应的单位张量:单个 3×3 单位矩阵(np.eye(3)),或沿第三维堆叠的 n 个独立单位矩阵(shape=(3,3,n)),满足每个切片 unit[:,:,k] 均为标准正交基变换矩阵。
最直观但低效的方式是手动初始化零数组并逐对角线赋值:
unit = np.zeros((3, 3, n)) unit[0, 0, :] = 1 unit[1, 1, :] = 1 unit[2, 2, :] = 1
这不仅代码冗长,且违背 NumPy 的向量化设计哲学。更优解是利用广播与维度扩展机制。
✅ 推荐方案一:np.repeat + reshape(原生 NumPy,无依赖)
先构建基础单位矩阵 I = np.eye(3),再沿新轴重复并重排维度:
import numpy as np def make_unit_matrices(x): d = x.shape[0] # 假设首维为维度数(如 3) if x.ndim == 1: return np.eye(d) elif x.ndim == 2: n = x.shape[1] I = np.eye(d) # 方法 A:展平后重复再重塑 return np.repeat(I, n).reshape(d, d, n) # 方法 B(更清晰):扩展维度后沿 axis=-1 重复 # return np.repeat(I.reshape(d, d, 1), n, axis=-1) else: raise ValueError("Unsupported input dimension")
该方法内存友好、执行迅速,且完全基于 NumPy 内置操作,适合轻量级部署。
✅ 进阶方案二:einops.repeat(语义清晰,可读性强)
若项目已引入 einops(强烈推荐用于复杂张量操作),可实现近乎自然语言的维度变换:
import einops as eo import numpy as np def make_unit_matrices_einops(x): d = x.shape[0] if x.ndim == 1: return np.eye(d) elif x.ndim == 2: n = x.shape[1] return eo.repeat(np.eye(d), 'd1 d2 -> d1 d2 n', n=n) else: raise ValueError("Unsupported input dimension")
‘d1 d2 -> d1 d2 n’ 明确表达了“将二维单位阵沿新维度 n 复制”,语义无歧义,易于维护与协作。
⚠️ 注意事项
- np.repeat(…).reshape(…) 要求总元素数匹配,务必确保 d*d*n 与重复次数一致;
- einops.repeat 自动校验维度兼容性,出错时提示更友好;
- 避免使用 np.tile(会复制数据而非视图),在大 n 场景下易引发内存暴涨;
- 若后续需参与 @ 矩阵乘法,注意 (3,3,n) 无法直接与 (3,n) 向量 @ 运算——应改用 np.einsum(‘ij…,j…->i…’, unit, x) 或 np.matmul(unit, x[None,…]) 等批处理方式。
综上,结合输入维度智能生成单位矩阵数组,首选 np.repeat + reshape 实现零依赖高效构造;追求工程可读性与长期可维护性,则 einops 是更优雅的选择。