pdf

Cách nén PDF mà không làm giảm chất lượng

Các ứng dụng email từ chối mọi tệp lớn hơn 20MB. Đây là cách thu nhỏ một tệp PDF xuống chỉ còn một phần kích thước ban đầu mà vẫn giữ văn bản sắc nét và hình ảnh dễ đọc — ngay trong trình duyệt, không cần bản quyền Acrobat.

Đội ngũ Pixoate6 phút đọc

Hầu hết PDF phình to vì cùng một vài lý do: ảnh scan độ phân giải cao, phông chữ nhúng, hình ảnh không nén và trình chỉnh sửa tạo ra chúng không buồn dọn dẹp. Kết quả là một tệp đính kèm email 30MB bị trả về, một trang portfolio mất mười giây để hiển thị một trang duy nhất và một lần tải lên CMS từ chối thẳng thừng file của bạn.

Tin tốt: phần lớn dung lượng đó có thể thu hồi mà không ai nhận ra. Đây là cách nén PDF mà trông không hề bị nén.

Vì sao PDF lại nặng ngay từ đầu

PDF về bản chất là một vật chứa. Nó có thể chứa văn bản vector, phông chữ, ảnh raster nhúng, biểu mẫu, tập lệnh, tệp đính kèm và lịch sử chỉnh sửa. Hai tệp PDF trông giống hệt nhau trên màn hình có thể chênh lệch kích thước rất lớn tùy thuộc vào những gì tác giả để lại bên trong.

  • PDF được quét là thủ phạm tệ nhất — mỗi trang là một ảnh DPI cao, thường được lưu mà không nén.
  • PDF nhiều ảnh (hồ sơ năng lực, báo cáo có biểu đồ) chứa các ảnh độ phân giải đầy đủ ngay cả khi chỉ hiển thị ở kích thước thu nhỏ.
  • Phông chữ nhúng có thể làm tăng hàng trăm kilobyte cho mỗi kiểu chữ, đặc biệt là các phông CJK với hàng nghìn ký tự.
  • PDF đã gộp thường kế thừa các tài nguyên không dùng đến từ mỗi tệp nguồn.

Bước 1: thử nén không mất dữ liệu trước

Trước khi đụng đến chất lượng ảnh, hãy chạy một lần mã hóa lại cơ bản. Trình nén PDF của Pixoate làm việc này chỉ trong một cú nhấp: nó ghi lại tệp với luồng đối tượng đúng chuẩn, loại bỏ tài nguyên trùng lặp và áp dụng nén ảnh hiện đại ở những chỗ tệp đang dùng codec cũ. Với hầu hết các tệp PDF tạo từ phần mềm văn phòng, chỉ riêng việc này đã giảm dung lượng 30–60% mà không thấy khác biệt.

Bước 2: nhắm tới thiết lập sẵn chất lượng ảnh phù hợp với trường hợp sử dụng

Nếu PDF của bạn sẽ được dùng để:

  • Gửi qua email hoặc đính kèm — dùng cài đặt sẵn "email" (≈150 DPI). Chữ vẫn sắc nét, ảnh trông ổn trên màn hình.
  • Đăng lên website — dùng cài đặt sẵn "web" (≈100 DPI). Tệp nhỏ nhất, hoàn toàn dễ đọc trên màn hình.
  • In tại nhà hoặc văn phòng — dùng cài đặt sẵn "print" (≈300 DPI). Tệp lớn hơn, nhưng chi tiết ảnh được giữ lại.

Cái bẫy là theo phản xạ chọn "chất lượng cao" cho mọi thứ. Nếu tệp được đọc trên màn hình, 150 DPI là quá đủ — con người không thể phân biệt được khác biệt ở khoảng cách xem thông thường.

Bước 3: thu nhỏ trước các ảnh nguồn

Nếu bạn kiểm soát được nguồn — chẳng hạn bạn đang ghép PDF từ một thư mục ảnh — hãy nén ảnh trước khi gộp chúng lại. Chạy chúng qua trình nén ảnh của Pixoate ở mức chất lượng 70–80%, rồi tạo PDF bằng ảnh sang PDF. Bạn sẽ có một tệp PDF nhỏ hơn, nhanh hơn so với việc nén tài liệu cuối cùng.

Bước 4: tách hoặc sắp xếp lại nếu bạn chỉ cần một phần

Đôi khi cách giảm dung lượng dễ nhất là gửi ít hơn. Nếu trang 47 là trang duy nhất ai đó cần, hãy dùng tách hoặc sắp xếp để chỉ trích xuất những trang đó. Một tệp PDF một trang mà người ta tìm thấy ngay thứ họ cần sẽ hơn hẳn một tệp PDF 200 trang mà họ phải cuộn mãi mới ra.

Những điều mà việc nén không khắc phục được

Các tệp PDF được quét mà không có lớp văn bản OCR sẽ luôn nặng dù làm gì đi nữa. Nếu bạn thấy một bản quét 50MB, công cụ phù hợp không phải là trình nén — mà là OCR. Hãy chạy qua công cụ OCR trước để thêm lớp văn bản có thể tìm kiếm, rồi mới nén; bạn gần như không mất gì vì lớp hình ảnh có thể được giảm độ phân giải mạnh tay một khi văn bản nằm ở một lớp riêng có thể chọn được.

Tóm tắt ngắn gọn

  1. Chạy nén PDF với cài đặt sẵn "email" hoặc "web".
  2. Nếu vẫn còn quá lớn, hãy xem bạn có thực sự cần mọi trang không — thử tách trang.
  3. Nếu bạn đang tạo PDF từ đầu, hãy nén ảnh trước bằng nén ảnh.
  4. Nếu là tài liệu được quét, hãy chạy OCR trước khi nén.

Hầu hết các file "không vừa" đều vừa, với mẫu cài sẵn phù hợp.

Có thể bạn cũng thích