如何正确提取PDF中的图像：解决PyMuPDF导出图片旋转、倒置与颜色异常问题

8次阅读

使用pymupdf（fitz）提取pdf图像时，常出现图像上下颠倒、左右镜像或色彩失真等问题，根本原因在于pdf坐标系（原点在左下角）与opencv/pil（原点在左上角）不一致，且pixmap的alpha通道和色彩空间未正确处理。本文提供完整、健壮的解决方案。

PDF内部采用数学笛卡尔坐标系：页面原点位于左下角，Y轴向上为正；而OpenCV、numpy数组及大多数图像库（包括PIL）约定图像原点在左上角，Y轴向下为正。因此，直接将PyMuPDF的Pixmap.samples按(h, w, n)重塑后直接使用，会导致图像垂直翻转（即视觉上“倒置”）。此外，document.extract_image()返回的是原始编码字节（如JPEG/JBIG2/Flate），可能丢失变换信息（如旋转矩阵、色彩校准），且不处理PDF中常见的CMYK、灰度带Alpha等非标准色彩空间——这正是你手动在Illustrator中无问题、但代码提取却变色的根本原因。

✅ 正确做法是：绕过extract_image()，直接基于xref构造Pixmap对象，并显式处理色彩空间与坐标翻转：

import fitz import numpy as np import cv2 import os  pdf_path = '/content/drive/MyDrive/Wettbewerb Aktuell/1803_AusgGesa-pages-2.pdf' output_directory = '/content/drive/MyDrive/Wettbewerb Aktuell/images/'  document = fitz.open(pdf_path) start_page, end_page = 0, min(1, document.page_count - 1) os.makedirs(output_directory, exist_ok=True)  for page_number in range(start_page, end_page + 1):     page = document[page_number]     images = page.get_images(full=True)     page_folder = os.path.join(output_directory, f"page_{page_number}/")     os.makedirs(page_folder, exist_ok=True)      for img_index, img in enumerate(images):         xref = img[0]  # 图像XREF引用号         try:             # ✅ 关键：用xref创建Pixmap（保留PDF原生渲染信息）             pix = fitz.Pixmap(document, xref)              # ✅ 处理多通道/Alpha：强制转为RGB（去除Alpha或合并）             if pix.n - pix.alpha > 3:  # 非标准色彩空间（如CMYK）                 pix = fitz.Pixmap(fitz.csRGB, pix)             elif pix.alpha:  # 含Alpha通道 → 合并到白色背景                 pix = fitz.Pixmap(fitz.csRGB, pix)                 # 注意：pix.pil_save() 自动处理Alpha，但numpy需手动             else:                 # 确保为RGB（pix.n == 3）或灰度（pix.n == 1）                 pass              # ✅ 正确转换为NumPy数组（注意：samples是C-contiguous bytes）             img_np = np.frombuffer(pix.samples, dtype=np.uint8).reshape(pix.h, pix.w, pix.n)              # ✅ 垂直翻转：适配PDF（左下原点）→ OpenCV（左上原点）             img_np = cv2.flip(img_np, 0)              # ✅ 颜色空间校正：Pixmap默认BGR-like顺序？实际为RGB（但cv2.imwrite要求BGR）             # 若pix.n == 3，且为RGB，则需转BGR；若已为BGR则跳过             # PyMuPDF Pixmap.samples 是RGB顺序（文档明确说明），故需转BGR供cv2.imwrite             if pix.n == 3:                 img_np = cv2.cvtColor(img_np, cv2.COLOR_RGB2BGR)              # 保存             img_path = os.path.join(page_folder, f"image_{img_index}.jpg")             cv2.imwrite(img_path, img_np)             print(f"✓ Saved: {img_path}")          except Exception as e:             print(f"✗ Failed to process image {img_index} on page {page_number}: {e}")         finally:             if 'pix' in locals():                 pix = None  # 显式释放Pixmap内存（重要！）  document.close()

? 关键注意事项：

永远优先使用 Pixmap(document, xref) 而非 extract_image()：前者执行PDF解释器级渲染，保留CTM（当前变换矩阵）、色彩配置、软掩模等元信息；后者仅解码原始流，易丢失方向与色彩上下文。
cv2.flip(img_np, 0) 不可省略：这是修复“倒置”的核心步骤，对应PDF坐标系到图像坐标系的映射。
色彩空间必须显式归一化：PDF支持CMYK、Lab、Indexed等，fitz.Pixmap(fitz.csRGB, pix) 强制转换为sRGB，避免OpenCV误读通道。
内存管理：Pixmap对象占用较大内存，务必在循环末尾设为None或使用with上下文（PyMuPDF v1.23+支持）。
调试建议：若仍有色偏，尝试用 pix.save(“debug.png”) 直接保存Pixmap（它自动处理翻转与色彩），对比是否与cv2.imwrite结果一致——若一致则问题在后续处理；若不一致，说明np.frombuffer重塑有误（检查pix.h/pix.w/pix.n是否匹配）。

通过以上方法，你将获得与Illustrator手动导出完全一致的方向、比例与色彩效果。

发表于：数据库

2026-01-15

复制链接

实现登录后跳转至原始目标页面的完整指南

如何在mysql中实现图书管理系统数据存储

如何在Golang中管理多重错误返回_Golang多错误返回处理与优化方法

mysql如何配置异步复制

VSCode系统兼容性问题_不同操作系统启动失败处理

如何正确提取PDF中的图像：解决PyMuPDF导出图片旋转、倒置与颜色异常问题

如何在 Apache 重写规则中保留原始 GET 参数（QSA 标志详解）

以太坊(ETH)交易所App下载入口 2026年ETH交易平台官网排名

php数组如何筛选回文串元素_php回文数组筛选技巧【技巧】

如何安全存储 Google OAuth 刷新令牌以持久化访问用户日历数据

c++如何实现装饰器模式_c++ 类包装与功能动态扩展【实战】

如何仅用 CSS 实现点击切换图片（非 JavaScript 方案）

Linux SSH 密钥认证失败的常见原因

Windows下PHP执行PY报错咋弄_跨系统兼容问题解决方法【指南】

Web-to-App转换中多图上传失效的解决方案与原生替代方案

mysql能不能像Java一样使用OOP_mysql与面向对象编程的区别