XSL-FO是W3C制定的xml页面布局规范,用于将XML数据精确排版为pdf等固定格式;它不渲染,需经FO处理器(如apache FOP)转换,流程为XML→XSLT→.fo→PDF,并需配置中文字体支持。

XSL-FO(Extensible Stylesheet Language – Formatting Objects)不是一种编程语言,而是一套基于 XML 的**页面布局描述规范**,由 W3C 制定,专用于把结构化数据(通常是 XML)精确排版成可打印、高保真的固定格式文档,比如 PDF、PostScript 或 AFP。
XSL-FO 的核心定位
它不直接处理逻辑或交互,只专注“怎么印出来”:页边距、分栏、页眉页脚、字体嵌入、表格对齐、断行避头尾、跨页表格保持完整……这些印刷级控制能力,是 html/css 在 PDF 生成中难以稳定实现的。
关键点在于:XSL-FO 本身不渲染,它只是中间描述文件(.fo),必须交由 FO 处理器(如 Apache FOP)翻译成 PDF。
生成 PDF 的标准两步流程
实际使用中,你几乎总是走这个链路:
- 用 XSLT 把原始 XML 数据(如订单、报表、发票)转换成符合 XSL-FO 语法的 .fo 文件
- 用 FO 处理器(例如 Apache FOP)读取 .fo,输出 PDF
整个过程清晰分离:XML 是数据,XSLT 是转换规则,XSL-FO 是排版蓝图,FOP 是印刷厂。
一个最小可用的 .fo 文件长什么样
下面这段代码保存为 hello.fo,就能直接用 FOP 生成 PDF:
<?xml version="1.0" encoding="UTF-8"?> <fo:root xmlns:fo="http://www.w3.org/1999/XSL/Format"> <fo:layout-master-set> <fo:simple-page-master master-name="A4" page-width="210mm" page-height="297mm" margin="20mm"> <fo:region-body/> </fo:simple-page-master> </fo:layout-master-set> <fo:page-sequence master-reference="A4"> <fo:flow flow-name="xsl-region-body"> <fo:block font-size="16pt" font-weight="bold" text-align="center">Hello, PDF!</fo:block> <fo:block font-size="12pt" margin-top="12pt">这是用 XSL-FO 生成的第一页。</fo:block> </fo:flow> </fo:page-sequence> </fo:root>
注意几个必需元素:<root></root> 是根,<layout-master-set></layout-master-set> 定义纸张和区域(body / before / after),<page-sequence></page-sequence> 绑定模板并组织内容流。
中文支持与字体配置(最容易卡住的一步)
Apache FOP 默认不带中文字体,直接跑上面的 .fo 会丢字或显示方块。解决方法很明确:
- 下载一个 TrueType 中文字体(如 Noto Sans CJK SC、思源黑体、微软雅黑)
- 在 FOP 配置文件 fop.xconf 的
<fonts></fonts>节点下添加字体目录或具体字体路径 - 在 .fo 文件里显式指定
font-family="Noto Sans CJK SC"(名称必须和配置中完全一致)
配置示例片段:
<renderer mime="application/pdf"> <fonts> <directory>./fonts</directory> <font embed-url="fonts/NotoSansCJKsc-Regular.otf"> <font-triplet name="Noto Sans CJK SC" style="normal" weight="normal"/> </font> </fonts> </renderer>
基本上就这些。不需要学新语法体系,只要理解“XML → XSLT → FO → PDF”这条链,掌握 layout-master、region-body、block、inline 这几个核心标签,再搞定中文字体,就能稳定产出专业 PDF。