Python xmltodict unparse full_document 是否生成XML声明

3次阅读

xmltodict.unparse() 默认不生成 xml 声明，需显式指定 encoding 参数（如 encoding=”utf-8″）才会输出；full_document 参数控制根元素包裹，与声明无关。

调用 xmltodict.unparse() 时，除非显式指定参数，否则输出的字符串**不含 <?xml version="1.0" encoding="utf-8"?> 这类声明**。这是它的默认行为，不是 bug，也不是遗漏。

原因很简单：xmltodict 的设计定位是轻量级 dict ↔ XML 转换，不强制绑定 XML 元信息；XML 声明属于文档级元数据，需要额外控制。

很多人试过 full_document=False 想“手动加声明”，结果发现没用——因为 full_document 控制的是是否包裹顶层 <root></root>，跟 XML 声明无关。

真正起作用的是两个参数组合：

示例：

import xmltodict data = {"note": {"to": "Tove", "from": "Jani"}} xml_str = xmltodict.unparse(data, encoding="utf-8")

输出以 <?xml version="1.0" encoding="utf-8"?> 开头。

设了 encoding 不只是“加一行文字”，它会真实影响字符串内容的编码逻辑：

如果 dict 中含中文，且 encoding="gbk"，unparse() 会尝试用 gbk 编码这些字符（可能抛 UnicodeEncodeError）
若未设 encoding，返回的是 Unicode 字符串，无字节编码动作；但此时也无 XML 声明
XML 声明中的 encoding 值必须与实际编码一致，否则解析器可能报错或乱码
python 3 下推荐统一用 encoding="utf-8"，兼容性最好，也最安全

如果你从文件读入带声明的 XML，用 xmltodict.parse() 解析后再 unparse()，得到的结果不会“继承”原声明。

复杂点在于：XML 声明里的 standalone="yes" 或 version="1.1" 这类属性，xmltodict 根本不支持输出，unparse() 只认 encoding 和默认 version="1.0"。

发表于：数据库

近一天内

复制链接

C++怎么使用策略模式_C++算法封装教程【灵活】

在html中如何让A标签可以下载文件