PDF

如何在不损失质量的前提下压缩 PDF

邮件客户端会拒收超过 20MB 的内容。下面教你如何在保持文字清晰、图片可读的前提下,将 PDF 压缩到原来的几分之一——全程在浏览器中完成,无需 Acrobat 授权。

Pixoate 团队6 分钟阅读

大多数 PDF 体积暴涨都源于同样几个原因:高分辨率扫描件、内嵌字体、未压缩的图片,以及生成它的编辑器懒得做清理。结果就是:30MB 的邮件附件被退回、作品集网站渲染单页就要花上十秒,以及 CMS 直接拒绝上传你的文件。

好消息是:其中大部分体积都能在无人察觉的情况下被压缩下来。下面就教您如何在不留压缩痕迹的前提下压缩 PDF。

PDF 文件为何会变得如此之大

PDF 本质上是一个容器。它可以容纳矢量文字、字体、嵌入的位图、表单、脚本、附加文件和修订历史。两个在屏幕上看起来完全一样的 PDF,文件大小可能天差地别,这取决于作者在里面留下了什么。

  • 扫描生成的 PDF是最大的元凶——每一页都是高 DPI 图像,而且往往未经任何压缩。
  • 图片繁多的 PDF(作品集、含图表的报告)即使以缩略图尺寸显示,也会携带全分辨率图像。
  • 嵌入的字体每种字型都可能增加数百 KB,尤其是包含数千个字形的中日韩字体。
  • 合并后的 PDF往往会从每个源文件继承未使用的资源。

第 1 步:先尝试无损压缩

在调整图像质量之前,先做一次基础的重新编码。Pixoate 的 PDF 压缩器 一键即可完成:它用规范的对象流重写文件,移除重复资源,并在文件原本使用旧编解码器的地方应用现代图像压缩。对于大多数办公软件生成的 PDF,仅此一项就能在毫无可见差异的情况下将体积缩减 30–60%。

第 2 步:选定与使用场景匹配的图片质量预设

如果你的 PDF 将用于:

  • 通过邮件发送或作为附件——使用「email」预设(约 150 DPI)。文字保持清晰,照片在屏幕上看起来也不错。
  • 发布到网站——使用「web」预设(约 100 DPI)。文件最小,在屏幕上完全清晰可读。
  • 在家或办公室打印——使用「print」预设(约 300 DPI)。文件更大,但照片细节得以保留。

常见的陷阱是对所有文件都下意识地选择“高质量”。如果文件只是在屏幕上阅读,150 DPI 就绰绰有余——在正常观看距离下,人眼根本看不出差别。

第 3 步:预先缩小原始图片

如果你能掌控源文件——比如你要把一整个文件夹的照片合成一份 PDF——请在合并_之前_先压缩这些图片。用 Pixoate 的 图片压缩器 以 70–80% 的质量处理它们,再用 图片转 PDF 生成 PDF。这样得到的 PDF 会比对成品文档进行压缩更小、加载更快。

第 4 步:如果只需要其中一部分,就拆分或重新整理

有时缩减体积最简单的办法就是少发一些。如果大家只需要第 47 页,用拆分整理把那几页单独提取出来。一份让人一眼就能找到所需内容的单页 PDF,胜过一份需要不停滚动翻阅的 200 页 PDF。

压缩解决不了的问题

没有 OCR 文本层的扫描 PDF 无论如何都会很大。如果你看到一个 50MB 的扫描件,合适的工具不是压缩器——而是 OCR。先用 OCR 工具为其添加可搜索的文本层,再进行压缩;这样几乎不会损失任何内容,因为一旦文本位于单独的可选层中,图像层就可以被大幅降采样。

简而言之

  1. 使用「email」或「web」预设运行 PDF 压缩
  2. 如果还是太大,看看是否每一页都需要——试试拆分
  3. 如果你要从零开始制作 PDF,请先用 图片压缩 压缩你的图片。
  4. 如果是扫描件,请先做 OCR 再压缩。

大多数「装不下」的文件,只要用对预设其实都能装下。

你可能还喜欢