MATLAB如何导入和解析XML数据 readstruct函数用法

28次阅读

readStruct函数自R2021a起支持直接读xml结构体,适用于标准配置类或表格型XML;不适用深度嵌套或含命名空间的复杂XML;常用选项包括’OutputFormat’、’RownodeName’等。

MATLAB如何导入和解析XML数据 readstruct函数用法

matlab 从 R2021a 开始提供 readstruct 函数,专用于将 XML 文件直接读取为结构体(struct),比传统 xmlread + 手动解析更简洁、易用,适合大多数标准格式的配置类或表格型 XML。

支持的 XML 结构类型

该函数适用于具有清晰层级和重复元素的 XML,例如:

  • 配置文件(含属性和嵌套参数)
  • 带表头的简单数据列表(类似 csv 的行/列结构)
  • 符合“一个根节点 + 多个同名子节点”模式的文档(如多个 <item></item>

不适用于深度嵌套、混合文本与子节点、或需自定义命名空间处理的复杂 XML —— 此类仍建议用 xmlread 配合 dom 解析。

基本用法:读取 XML 到结构体

最简调用只需文件路径:

s = readstruct('data.xml');

返回结构体 s,字段名默认对应 XML 根节点下的直接子节点名。若 XML 是如下形式:

MATLAB如何导入和解析XML数据 readstruct函数用法

Text-To-Pokemon口袋妖怪

输入文本生成自己的Pokemon,还有各种选项来定制自己的口袋妖怪

MATLAB如何导入和解析XML数据 readstruct函数用法 1487

查看详情 MATLAB如何导入和解析XML数据 readstruct函数用法

<config>   <database host="localhost" port="5432"/>   <users>     <user name="Alice" role="admin"/>     <user name="Bob" role="guest"/>   </users> </config>

s.database 是含字段 hostport 的标量结构体;s.users.user 是 1×2 结构体数组,每个含 namerole 字段。

常用选项控制解析行为

通过 Name-Value 参数微调读取结果:

  • 'OutputFormat','table':强制输出为 table(适合扁平化数据,自动展开重复字段)
  • 'RowNodeName','item':指定哪一类子节点作为“行”,用于生成 table 或结构体数组(如 XML 中有多个 <item></item>
  • 'AttributeNamePrefix','@':把属性名加上前缀(默认是 @),避免与子节点名冲突,例如 @hosthost 可区分
  • 'TextContentFieldName','text':显式命名文本内容字段(当节点含纯文本时,如 <name>John</name>s.name.text = 'John'

处理常见问题的小技巧

如果读出的结构体字段名含非法字符(如短横线 -),MATLAB 会自动替换为下划线(_),例如 <api-key></api-key> → 字段名 api_key;也可用 'VariableNamingRule','preserve' 保留原名(但后续访问需用圆点加引号语法:s.("api-key"))。

若 XML 包含数字字符串(如 <count>42</count>),readstruct 默认按字符串读取;需数值类型时,可后续用 str2double 转换,或借助 convertvars(配合 'OutputFormat','table' 时)批量处理列类型。

text=ZqhQzanResources