怎么把XML转换成CSV格式

3次阅读

xmlcsv的核心是将树状结构扁平化为行列结构,需明确字段、处理嵌套与缺失值;推荐python内置elementtree+csv模块实现,或用yq+xsv、xmlstar等命令行工具,小文件可用在线工具或excel

怎么把XML转换成CSV格式

把XML转换成CSV格式,核心是提取XML中的结构化数据,按行和列组织成表格形式。XML是树状嵌套结构,CSV是扁平的行列结构,所以转换的关键在于:明确你要导出哪些字段、如何处理嵌套与重复节点、以及如何应对缺失或不规则数据


用Python快速实现(推荐初学者)

Python的xml.etree.ElementTree(内置)配合csv模块就能完成大多数场景:

import xml.etree.ElementTree as ET import csv  # 1. 解析XML文件 tree = ET.parse("data.xml") root = tree.getroot()  # 2. 定义要提取的字段(对应CSV列名) headers = ["name", "age", "city"]  # 3. 收集所有记录 rows = [] for person in root.findall("person"):  # 假设每个<person>是一行     row = {         "name": person.find("name").text if person.find("name") is not None else "",         "age": person.find("age").text if person.find("age") is not None else "",         "city": person.find("address/city").text if person.find("address/city") is not None else ""     }     rows.append([row[h] for h in headers])  # 4. 写入CSV with open("output.csv", "w", newline="", encoding="utf-8") as f:     writer = csv.writer(f)     writer.writerow(headers)     writer.writerows(rows)

✅ 适合:结构清晰、层级固定、重复节点为同级元素(如多个 <person></person>
⚠️ 注意:find() 只找直接子节点;要用 find("parent/child") 处理嵌套;空值要手动处理,否则会报错。


用命令行工具(适合批量或自动化

  • xsv + yq(推荐)
    先用 yq(v4+)把XML转成json,再用 xsv 转CSV:

    yq -p xml -o json data.xml | xsv format --no-headers --delimiter "," > output.csv

    需安装:brew install yq xsvmacos)或从 github 下载二进制版。

  • xmlstar(老牌可靠)
    直接提取XPath结果,拼成CSV:

    xmlstar --text --cat    --xpath "//person/name"    --xpath "//person/age"    --xpath "//person/address/city"    data.xml | paste -sd ',' - > output.csv

✅ 适合:linux/macOS环境、无需写代码、处理大量文件
⚠️ 注意:xmlstar 输出默认带换行,paste 用于合并成行;字段顺序即XPath顺序,需严格对齐。


用在线工具或Excel(适合小文件、临时处理)

  • Online-Convert.com / ConvertCSV.com
    上传XML → 选择“XML to CSV” → 下载结果。
    ✅ 快速、免安装
    ❌ 不适合含敏感数据、大文件(通常限5–10MB)、嵌套深或命名空间复杂的情况。

  • Excel(windows,Office 365 或 2019+)
    数据 → 获取数据 → 从文件 → 从XML → 导入后,Excel会尝试推断结构 → 再另存为CSV。
    ✅ 图形界面友好,支持预览
    ❌ 对重复节点(如多个 <item></item>)可能合并或丢失,需手动调整查询表。


基本上就这些。选哪种方式,取决于你的XML结构是否规整、数据量大小、是否需要重复使用,以及你是否能运行代码或命令行。结构简单就用Python脚本;想省事就用在线工具;要批量处理就上命令行。

text=ZqhQzanResources