PDF

PDF til Word: hvilket konverteringsværktøj bevarer faktisk din formatering?

De fleste PDF-til-Word-konvertere ødelægger dine tabeller, roder med skrifttyperne eller springer billeder helt over. Her er, hvad der kendetegner en god konverter, hvorfor scannede PDF'er kræver OCR, og hvordan du håndterer enhver type PDF.

Pixoate-teamet8 min. læsetid

PDF blev designet til at se ens ud på alle enheder. Det er dens store styrke og grunden til, at den er irriterende at redigere. Når du konverterer en PDF til Word, beder du et værktøj om at reverse-engineere dokumentet — finde ud af, hvilke tegn der hører til hvilket afsnit, hvor tabellerne er, hvad overskrifterne er, hvad der er en fodnote, og hvad der ikke er. Nogle konverteringsværktøjer gør det godt. De fleste gør det dårligt.

Her er et hurtigt beslutningstræ og en forklaring på, hvad der gør en konverter rigtig god.

Første spørgsmål: er PDF'en en ægte PDF eller en scanning?

Hvis du kan markere teksten med musen inde i PDF-læseren, er det en rigtig PDF med faktisk tekstindhold. Hvis du ikke kan — hvis teksten opfører sig som et billede — så er det en scanning, selv hvis den ikke ser sådan ud. Konverteringsvejen er helt anderledes.

Til ægte PDF-filer

PDF til Word læser den indlejrede tekst og layoutet og genopbygger det derefter som en .docx. Gode konverteringsværktøjer bevarer afsnit, overskrifter, lister, enkle tabeller og indlejrede billeder. Helt almindelige kontordokumenter kommer ud rent redigerbare.

Til scannede PDF-filer

Du skal bruge OCR først. PDF til tekst med OCR aktiveret giver dig den rå tekst; for et struktureret dokument med formatering skal du bruge billede til Word på hver side (eller køre hele PDF'en igennem). Resultatet vil ikke se identisk ud med scanningen, men teksten bliver redigerbar, og strukturen bevares.

Hvad konvertere gør forkert

De klassiske fejl, nogenlunde i den rækkefølge, de sker:

  • Tabeller bliver til tekstbokse. Dårlige konvertere gør hver celle til et flydende element. Tabellen ser rigtig ud, men du kan ikke reelt redigere den som en tabel.
  • Layouts med flere spalter falder sammen. Et nyhedsbrev med to spalter bliver til én spalte med teksten fra begge spalter klodset flettet sammen.
  • Skrifttyper bliver lydløst erstattet. Hvis din PDF bruger en skrifttype, Word ikke har, får du noget, der ligner — men ikke det samme — og dine linjeskift flytter sig.
  • Fodnoter løsrives. Fodnoteteksten ender som et løst afsnit nederst på siden, ikke længere knyttet til markøren.
  • Sidehoveder og sidefødder bliver til brødtekst. Sidetal, sidehoveder og sidefødder kommer igennem som afsnit midt i teksten.

Hvad en god konverter gør

Målestokken er genkendeligt layout, redigerbare tabeller, bevarede lister og indlejrede billeder, der bliver, hvor du placerede dem. Pixoates PDF til Word rammer den målestok for de fleste kontortypiske PDF'er: kontrakter, rapporter, formularer, breve. Den bruger en layout-bevidst pipeline, der registrerer tabelgitre og rekonstruerer dem som indbyggede Word-tabeller, ikke tekstbokse. Overskrifter bevarer deres hierarki. Punkt- og nummererede lister kommer igennem som lister, ikke som tekstlinjer, der ligner lister.

Den anden vej rundt

Hvis du genererer en PDF fra et Word-dokument (og vil have, at den ser nøjagtig ud som i Word), så brug Word til PDF. Den kører en rigtig LibreOffice-rendering, så outputtet matcher det, du ville få ved at klikke på "Gem som PDF" i Word — skrifttyper indlejret, layout bevaret, ingen overraskelser.

Andre formater værd at kende

  • PDF til HTML, når du vil have en webside. PDF til HTML bevarer rigtige <table>-elementer og overskrifter, så resultatet er læsbar HTML og ikke et skærmbillede pakket ind i markup.
  • PDF til Excel, når PDF'en mest består af tabeller. PDF til Excel udtrækker hver tabel til sit eget ark med fastlåste overskrifter.
  • PDF til CSV til rå tabeldata, som du vil importere et andet sted. PDF til CSV pakker én CSV pr. tabel i en zip-fil.
  • PDF til billeder, når du har brug for hver side som en PNG — for eksempel til et slideshow eller en portfolio. PDF til billeder gengiver som standard ved 200 DPI.

Hvornår du bør opgive konverteringen og bare sende PDF'en

Hvis modtageren kun har brug for at læse eller udskrive PDF'en, så lad være med at konvertere den. Komprimér den i stedet med PDF-komprimering, og send PDF'en direkte. Konvertering er til, når du har brug for at redigere; hvis ikke, tilføjer du blot et trin, der kan forringe kvaliteten.

Du kan også lide