Web Service上传附件 SOAP带附件的XML传输协议

2次阅读

MTOM是SOAP上传附件的唯一标准方案,它将二进制附件分离为独立MIME part,xml仅保留xop:include引用;需WSDL声明mtom=”true”、客户端服务端均启用MTOM并配置对应拦截器或编码方式,缺一不可。

Web Service上传附件 SOAP带附件的XML传输协议

SOAP 上传附件时,MTOM 是唯一靠谱的选择

不用 MTOM,硬塞二进制进 XML 字符串(比如 base64),基本等于自找麻烦:体积膨胀约 33%,解析慢,内存爆得快,服务端还可能直接拒收超长 text 节点。SOAP 协议本身不传文件,MTOM(Message Transmission Optimization Mechanism)才是 W3C 标准里专门干这事的机制——它把附件抽成独立的二进制 part,XML 只留个 xop:Include 引用。

实操建议:

  • 客户端和服务端必须同时启用 MTOM,光一端开没用;检查 WSDL 里有没有 mtom="true"type="application/xop+xml"
  • Java Axis2 / CXF 默认关 MTOM,得显式设 binding.setMTOMEnabled(true);.NET 的 BasichttpBinding 要配 messageEncoding="Mtom"
  • 别手动拼 multipart/related 请求体——所有主流 SOAP 库(如 Python 的 zeep、Java 的 jaxws-ri)都内置 MTOM 支持,调用时传 bytesFile 对象即可,库自动拆包

Attachment 在 SOAP 消息里根本不存在

这是最常被文档带偏的点:WSDL 和 SOAP 规范里压根没有叫 Attachment 的元素或类型。所谓“附件”,只是 MTOM 封装后 HTTP body 里的一个独立 MIME part,XML 正文里只出现类似这样的占位符:。如果你在 XML 中硬加了个 ... 节点,那只是普通字符串字段,不是附件。

常见错误现象:

  • 服务端收到的是 base64 编码的长字符串,而不是原始文件流
  • wireshark 抓包发现 HTTP body 是纯文本 XML,没看到 multipart/related boundary
  • WSDL 中 xs:base64Binary 类型字段被当成普通参数传,实际走的是 XML 内联编码,不是 MTOM

Python zeep 传文件必须用 requests 会话 + MTOM 绑定

zeep 默认用 httpx,但 MTOM 支持依赖底层 HTTP client 对 multipart 的正确构造。requests 更稳,且需手动指定传输绑定。

实操建议:

  • 创建 client 时传 transport=Transport(session=requests.Session())
  • 确保 WSDL 地址返回的 binding 包含 mtom="true",否则 zeep 会 fallback 到文本模式
  • 调用方法时,附件字段直接传 open("file.pdf", "rb").read()io.BytesIO(data),别转成 base64 字符串
  • 如果报错 ValueError: Cannot serialize bytes Object,说明 zeep 没识别出 MTOM,回头检查 WSDL 或强制指定 plugins=[WsdlPlugin()]

Java CXF 客户端收不到附件?先看 AttachmentInInterceptor 是否注册

CXF 默认不解析入站的 MTOM part,需要显式加拦截器,否则 javax.activation.DataHandler 字段永远是 NULL

关键配置点:

  • 客户端代码里加:client.getOutInterceptors().add(new org.apache.cxf.interceptor.AttachmentOutInterceptor());
  • 服务端对应要加:server.getInInterceptors().add(new org.apache.cxf.interceptor.AttachmentInInterceptor());
  • 如果用 spring 配置,确认 cxf.xml 里有
  • 调试时打印 message.getAttachments(),为空就说明拦截器没生效,跟 WSDL 或 binding 无关

事情说清了就结束。MTOM 不是开关,是整条链路的契约——WSDL、binding、client、server、HTTP 层,缺一不可。最容易被忽略的是服务端拦截器和客户端传输绑定的匹配,这两个点卡住,其他全对也白搭。

text=ZqhQzanResources