什么是DSDL文档模式定义语言

11次阅读

DSDL是ISO/IEC 19757定义的xml文档验证标准集合,采用模块化设计:Part 3(Schematron)校验语义规则,Part 4(NVDL)处理多命名空间路由,Part 7(CREPDL)约束字符集,Part 9增强DTD,Part 11支持模式动态关联。

什么是DSDL文档模式定义语言

DSDL(Document Schema Definition Languages,文档模式定义语言)是一组用于XML文档验证与结构处理的国际标准规范集合,由ISO/IEC 19757系列标准定义。它不追求“一个全能模式语言”,而是把不同用途、不同粒度的验证任务拆解成多个独立又可协作的子标准,让开发者按需选用或组合使用。

核心设计思想:分而治之,各司其职

DSDL强调模块化验证——比如用RELAX NG检查语法结构,用Schematron校验业务规则,用NVDL处理混合命名空间文档。这种分工避免了单个语言过度复杂,也提升了验证的准确性和可维护性。

  • 每个部分解决一类明确问题:结构约束、规则断言、命名空间路由、字符集声明、DTD增强等
  • 各部分互不替代,但可通过约定方式协同工作(如NVDL调用RELAX NG和Schematron进行分段验证)
  • 所有规范都面向XML(及兼容的SGML派生格式),不直接用于htmljsON

已发布的主要部分及其用途

目前ISO/IEC 19757已正式发布多个部分,常见且实用的包括:

  • Part 3(Schematron):基于XPath表达式的规则验证语言,适合写“订单金额不能为负”“发货日期不得早于下单日期”这类语义规则
  • Part 4(NVDL):命名空间驱动的验证分发语言,适用于含多个命名空间的复合文档(如svg嵌入xhtml再混入mathml
  • Part 7(CREPDL):描述字符集范围与限制,用于确保文档只使用授权字符(如仅限GB18030汉字或排除控制字符)
  • Part 9(DTD扩展):在传统DTD中补充命名空间支持和数据类型声明能力
  • Part 11(Schema association):定义如何将模式(schema)与具体XML文档实例动态关联,例如通过处理指令或外部元数据

和常见模式语言的区别

DSDL不是替代DTD、XML Schema(XSD)或RELAX NG,而是提供更高层的整合框架:

  • DTD/XSD侧重“结构合法性”,DSDL中的Schematron补足“业务合理性”
  • RELAX NG擅长简洁结构定义,DSDL中的NVDL让它能嵌入到更复杂的多命名空间场景中
  • 所有DSDL组件都设计为可独立运行,也可被构建进统一验证流水线(如通过apache JingOxygen XML Editor支持)
text=ZqhQzanResources