pdf

PDF ke Word: alat konversi mana yang benar-benar mempertahankan format Anda?

Sebagian besar konverter PDF-ke-Word merusak tabel, mengacaukan font, atau melewatkan gambar sepenuhnya. Inilah yang membuat sebuah konverter bagus, mengapa PDF hasil pindai memerlukan OCR, dan cara menangani setiap jenis PDF.

Tim Pixoate8 menit baca

PDF dirancang agar tampil identik di setiap perangkat. Itulah kekuatan utamanya sekaligus alasan mengapa ia menyebalkan untuk diedit. Ketika Anda mengonversi PDF ke Word, Anda meminta sebuah alat untuk merekayasa balik dokumen tersebut — mencari tahu karakter mana yang termasuk paragraf mana, di mana letak tabel, mana judulnya, mana yang catatan kaki dan mana yang bukan. Sebagian konverter melakukannya dengan baik. Kebanyakan melakukannya dengan buruk.

Berikut panduan keputusan singkat, dan apa yang membuat sebuah konverter benar-benar bagus.

Pertanyaan pertama: apakah PDF tersebut PDF asli atau hasil pindai?

Jika Anda bisa menyeleksi teks dengan kursor di dalam pembaca PDF, berarti itu PDF asli dengan konten teks yang sebenarnya. Jika tidak bisa — jika teksnya berperilaku seperti gambar — berarti itu hasil pindaian, meski tampilannya tidak terlihat begitu. Jalur konversinya sama sekali berbeda.

Untuk PDF asli

PDF ke Word membaca teks dan tata letak yang tertanam, lalu membangunnya kembali sebagai .docx. Konverter yang baik mempertahankan paragraf, judul, daftar, tabel sederhana, dan gambar sebaris. Dokumen kantor pada umumnya akan keluar dalam keadaan rapi dan dapat diedit.

Untuk PDF hasil pindai

Anda perlu OCR terlebih dahulu. PDF ke teks dengan OCR diaktifkan memberi Anda teks mentahnya; untuk dokumen terstruktur dengan format, gunakan gambar ke Word pada setiap halaman (atau jalankan seluruh PDF sekaligus). Hasilnya tidak akan tampak persis seperti pindaian, tetapi teksnya dapat diedit dan strukturnya tetap dipertahankan.

Kesalahan yang dilakukan konverter

Kegagalan klasik, kurang lebih sesuai urutan terjadinya:

  • Tabel menjadi kotak teks. Konverter yang buruk mengubah setiap sel menjadi elemen melayang. Tabel tampak benar; tapi Anda tidak bisa benar-benar mengeditnya sebagai tabel.
  • Tata letak banyak kolom runtuh. Buletin dua kolom menjadi satu kolom dengan teks dari kedua kolom tercampur secara janggal.
  • Font diganti tanpa pemberitahuan. Jika PDF Anda menggunakan font yang tidak dimiliki Word, Anda mendapat sesuatu yang mirip — tapi tidak sama — dan pemenggalan baris Anda bergeser.
  • Catatan kaki terlepas. Teks catatan kaki berakhir sebagai paragraf liar di bagian bawah halaman, tidak lagi tertaut ke penandanya.
  • Header dan footer menjadi teks isi. Nomor halaman, header, dan footer muncul sebagai paragraf di tengah alur teks.

Apa yang dilakukan konverter yang baik

Standarnya adalah tata letak yang dikenali, tabel yang dapat diedit, daftar yang terjaga, dan gambar inline yang tetap berada di tempat yang Anda inginkan. PDF ke Word dari Pixoate memenuhi standar itu untuk sebagian besar PDF gaya perkantoran: kontrak, laporan, formulir, surat. Alat ini menggunakan pipeline yang sadar tata letak yang mendeteksi grid tabel dan menyusunnya kembali sebagai tabel Word asli, bukan kotak teks. Heading mempertahankan hierarkinya. Daftar berpoin dan bernomor diteruskan sebagai daftar, bukan baris teks yang sekadar terlihat seperti daftar.

Arah sebaliknya

Jika Anda membuat PDF dari dokumen Word (dan ingin tampilannya persis seperti di Word), gunakan Word ke PDF. Alat ini menjalankan proses render LibreOffice yang sesungguhnya, sehingga hasilnya sama dengan ketika Anda mengeklik "Save as PDF" di Word — font tertanam, tata letak terjaga, tanpa kejutan.

Format lain yang perlu diketahui

  • PDF ke HTML bila Anda menginginkan halaman web. PDF ke HTML mempertahankan elemen <table> dan heading yang asli, sehingga keluarannya adalah HTML yang bisa dibaca, bukan tangkapan layar yang dibungkus markup.
  • PDF ke Excel bila PDF sebagian besar berisi tabel. PDF ke Excel mengekstrak setiap tabel ke lembarnya sendiri dengan header yang dibekukan.
  • PDF ke CSV untuk data tabel mentah yang akan Anda impor di tempat lain. PDF ke CSV memaketkan satu CSV per tabel dalam zip.
  • PDF ke Gambar bila Anda perlu setiap halaman sebagai PNG — misalnya untuk presentasi slide atau portofolio. PDF ke gambar merender pada 200 DPI secara bawaan.

Kapan harus menyerah mengonversi dan cukup mengirim PDF saja

Jika pihak penerima hanya perlu membaca atau mencetak PDF, jangan dikonversi. Sebaiknya kompres saja dengan kompres PDF, lalu kirim PDF-nya langsung. Konversi diperlukan saat Anda harus menyunting; jika tidak, Anda hanya menambah langkah yang justru bisa menurunkan kualitas.

Anda mungkin juga menyukai