XML文件如何转换为CSV Excel Power Query导入XML数据

1次阅读

power query导入xml报错“key didn’t match any rows”主因是嵌套结构未逐层展开:需右键根节点选“展开”,勾选“使用原始列名作为前缀”;遇同名字段自动加后缀需手动清理;list列必须点击展开图标;csv乱码因utf-8无bom,应设为“utf-8 with bom”或改用excel表格导出;属性与文本内容需同时勾选value及属性列;复杂xml禁用xml.tables(),须用xml.document()手动导航;file://路径敏感,应改用file.contents()配合纯英文路径。

XML文件如何转换为CSV Excel Power Query导入XML数据

Power Query 导入 XML 文件时直接报错 Expression.Error: The key didn't match any rows in the table

这是最常见的卡点:XML 结构含嵌套层级或重复节点(比如多个 <item></item>),而 Power Query 默认只展开第一层,后续字段因路径不匹配直接崩掉。

  • 别急着点“转换为表”——先右键点击预览里的根节点(如 rootcatalog),选「展开」,勾选「使用原始列名作为前缀」,再点确定
  • 如果 XML 里有同名但不同层级的字段(比如 <price></price> 出现在 <book></book><author></author> 下),Power Query 会自动加后缀如 price.1price.2;这时得手动删掉不需要的列,或用 Table.RenameColumns 统一重命名
  • 遇到 list 类型列(值显示为 List),说明该节点是数组(比如多个 <author></author>);必须点它右边的「展开」图标,否则导出 CSV 时这列就变成 System.Collections.Generic.List`1[System.Object]

导出 CSV 后 Excel 打开乱码,中文全变问号

根本不是编码问题,而是 windows 记事本式 CSV 默认用 ANSI 编码,而 Power Query 导出 CSV 用的是 UTF-8 —— Excel 2016 及更早版本不会自动识别 UTF-8 BOM,直接当 ANSI 解析。

  • 导出前,在 Power Query 编辑器中点「文件 → 选项和设置 → 选项 → 当前文件 → 数据加载 → CSV 文件 → 编码」,改成 UTF-8 with BOM(若没这个选项,说明版本太低,需升级或换方法)
  • 更稳的方案:不导 CSV,改用「从 Power Query 导出到 Excel 表格」,或在 Excel 中用「数据 → 从其他来源 → 从 XML」重新导入(注意:此路径不走 Power Query 引擎,兼容性更好但失去 M 函数灵活性)
  • 如果必须用 CSV,且目标环境是旧版 Excel,可导出后用记事本打开,另存为「UTF-8-BOM」格式(记事本里编码下拉菜单叫「UTF-8」,实际就是带 BOM 的)

XML 里有属性(id="123")和文本内容(<name>张三</name>)混在一起,怎么一起提出来

Power Query 把属性当记录字段、文本内容当 Value 字段,但默认不同时保留;不手动干预就会丢一半。

  • 展开节点后,检查列名:属性会变成 idtype 等独立列;文本内容则在 Value 列里——如果没看到 Value,说明你点错了展开方式;要右键列标题 →「展开」→ 勾选 Value 和所有需要的属性
  • 若某节点既有属性又有子节点(比如 <book id="1"><title>Python入门</title></book>),Power Query 会把 id 提成列,但 title 变成嵌套记录;此时需对 title 列再次「展开」,并确保勾选 Value
  • 避免用 Xml.Tables() 函数直接解析——它只适配极简扁平结构;复杂 XML 必须用 Xml.Document() + 手动导航路径,例如:Xml.Document(File.Contents("data.xml"))[children]{0}[children]

Excel 里刷新 Power Query 时提示 DataSource.Error: Web.Contents failed to get contents from 'file://...'

不是权限问题,是 Power Query 对本地 file:// 协议路径极其敏感,尤其路径含中文、空格、括号或网络映射盘符时必炸。

  • 把 XML 文件移到纯英文路径下,比如 C:datareport.xml,然后在 Power Query 中用 File.Contents("C:datareport.xml") 替代原始的 file:// 链接
  • 如果 XML 在 onedrivesharepoint,别用本地路径;改用「数据 → 从云 → 从 OneDrive for Business」,粘贴共享链接,让 Power BI/Excel 自动处理认证
  • 刷新失败还可能因为 XML 文件被其他程序占用(比如用记事本开着),关掉所有编辑器再试;临时解决法:复制一份 XML 改名,指向新文件

Power Query 处理 XML 的核心难点不在语法,而在它把每个节点都当成“可能有属性、可能有文本、可能有子节点”的三重嵌套体——漏点哪一层的展开,后面就全是 NULLList。最常被忽略的是:你以为点了一次「展开」就完事了,其实得顺着树形结构,一层一层手动点下去。

text=ZqhQzanResources