如何将MATLAB .mat文件中的多个结构体数组批量转换为NumPy数组

9次阅读

如何将MATLAB .mat文件中的多个结构体数组批量转换为NumPy数组

本文介绍使用`scipy.io.loadmat`读取含嵌套结构体matlab .mat文件,并通过字典推导式高效提取`fanmap`和`fanmap1d`中全部字段,统一转为numpy数组,支持任意维度与命名访问。

MATLAB .mat 文件(尤其v7.3以下版本)常以结构体(Struct)形式存储多组异构数组,例如本例中的 fanmap 和 fanmap1D。它们并非普通NumPy数组,而是numpy.ndArray类型的结构化数组(structured array),其元素为dtype定义的字段集合,需通过索引(如 [0, 0])先定位到结构体实例,再用字段名访问内部数据。

正确解析的关键在于理解loadmat的返回结构:

  • mat[‘fanmap’] 是形状为 (1, 1) 的结构化数组;
  • mat[‘fanmap’][0, 0] 才是实际的结构体对象
  • mat[‘fanmap’][0, 0].dtype.names 提供所有字段名列表;
  • 每个字段(如 ‘pressure’, ‘efficiency’)可通过 mat[‘fanmap’][0, 0][‘fieldname’] 获取原始数组,再经 np.array() 确保类型纯净(尤其避免np.matrix等过时类型)。

以下是完整、健壮的转换代码:

from scipy.io import loadmat import numpy as np  # 加载.mat文件 mat = loadmat("FanMap_data.mat")  # 提取fanmap中所有字段并转为标准NumPy数组 if 'fanmap' in mat and mat['fanmap'].size > 0:     fanmap_struct = mat['fanmap'][0, 0]     fanmap_arrays = {         key: np.array(fanmap_struct[key]).squeeze()  # .squeeze()可选:移除长度为1的维度(如(1,15)→(15,))         for key in fanmap_struct.dtype.names     } else:     fanmap_arrays = {}  # 提取fanmap1D中所有字段 if 'fanmap1D' in mat and mat['fanmap1D'].size > 0:     fanmap1D_struct = mat['fanmap1D'][0, 0]     fanmap1D_arrays = {         key: np.array(fanmap1D_struct[key]).squeeze()         for key in fanmap1D_struct.dtype.names     } else:     fanmap1D_arrays = {}  # 验证结果 print("✅ fanmap 包含数组:") for name, arr in fanmap_arrays.items():     print(f"  '{name}' → shape {arr.shape}, dtype {arr.dtype}")  print("n✅ fanmap1D 包含数组:") for name, arr in fanmap1D_arrays.items():     print(f"  '{name}' → shape {arr.shape}, dtype {arr.dtype}")

注意事项: 若.mat文件由MATLAB R2016b+保存且启用-v7.3选项,则需改用h5py库读取(scipy.io.loadmat不支持HDF5格式); .squeeze() 可按需添加,用于简化单维数组(如 (1, 15) → (15,)),但若后续需保持二维语义(如矩阵运算),应保留原始形状; 字段名区分大小写,确保MATLAB中定义的字段名与python中引用一致; 建议增加try/except或存在性检查(如示例所示),避免因字段缺失导致运行时错误。

转换后,所有数组均以标准numpy.ndarray形式存于字典中,可直接用于科学计算、绘图(如matplotlib)、机器学习(如scikit-learn)等下游任务,实现MATLAB数据到Python生态的无缝迁移。

text=ZqhQzanResources