PDF

PDF til Word: hvilket konverteringsverktøy bevarer egentlig formateringen din?

De fleste PDF-til-Word-konverterere ødelegger tabellene dine, roter til skriftene eller hopper helt over bilder. Her er hva som kjennetegner en god konverterer, hvorfor skannede PDF-er trenger OCR, og hvordan du håndterer enhver type PDF.

Pixoate-teamet8 min lesetid

PDF ble utviklet for å se identisk ut på alle enheter. Det er den store styrken og samtidig grunnen til at formatet er irriterende å redigere. Når du konverterer en PDF til Word, ber du et verktøy om å rekonstruere dokumentet – finne ut hvilke tegn som hører til hvilket avsnitt, hvor tabellene er, hva som er overskrifter, og hva som er en fotnote og hva som ikke er det. Noen konverterere gjør dette bra. De fleste gjør det dårlig.

Her er et raskt beslutningstre, og hva som gjør en konverter virkelig god.

Første spørsmål: er PDF-en en ekte PDF eller en skanning?

Hvis du kan markere teksten med musa inne i PDF-leseren, er det en ekte PDF med faktisk tekstinnhold. Hvis du ikke kan det – hvis teksten oppfører seg som et bilde – er det en skanning, selv om den ikke ser slik ut. Konverteringsmetoden er helt forskjellig.

For ekte PDF-er

PDF til Word leser den innebygde teksten og layouten, og gjenoppbygger den deretter som en .docx. Gode konvertere bevarer avsnitt, overskrifter, lister, enkle tabeller og innebygde bilder. Helt vanlige kontordokumenter kommer ut rent redigerbare.

For skannede PDF-er

Du trenger OCR først. PDF til tekst med OCR aktivert gir deg råteksten; for et strukturert dokument med formatering bruker du bilde til Word på hver side (eller kjører hele PDF-en gjennom). Resultatet vil ikke se identisk ut med skanningen, men teksten vil være redigerbar og strukturen bevart.

Hva konverterere gjør feil

De klassiske feilene, omtrent i den rekkefølgen de skjer:

  • Tabeller blir tekstbokser. Dårlige konverterere gjør hver celle om til et flytende element. Tabellen ser riktig ut, men du kan ikke faktisk redigere den som en tabell.
  • Flerspaltede oppsett kollapser. Et nyhetsbrev med to spalter blir til én spalte der teksten fra begge spaltene er klosset flettet sammen.
  • Skrifter byttes ut i stillhet. Hvis PDF-en din bruker en skrift Word ikke har, får du noe som ligner – men ikke det samme – og linjeskiftene forskyver seg.
  • Fotnoter løsner. Fotnoteteksten ender opp som et frittstående avsnitt nederst på siden, ikke lenger knyttet til markøren.
  • Topp- og bunntekster blir brødtekst. Sidetall, topptekster og bunntekster kommer gjennom som avsnitt midt i tekstflyten.

Hva en god konverterer gjør

Målestokken er gjenkjennelig layout, redigerbare tabeller, bevarte lister og innebygde bilder som blir der du plasserte dem. Pixoates PDF til Word når den målestokken for de fleste kontortype-PDF-er: kontrakter, rapporter, skjemaer, brev. Den bruker en layoutbevisst prosess som gjenkjenner tabellrutenett og bygger dem opp igjen som ekte Word-tabeller, ikke tekstbokser. Overskrifter beholder hierarkiet sitt. Kulepunkt- og nummererte lister kommer gjennom som lister, ikke tekstlinjer som ser ut som lister.

Den andre veien

Hvis du genererer en PDF fra et Word-dokument (og vil at den skal se nøyaktig ut som i Word), bruk Word til PDF. Den kjører en ekte LibreOffice-gjengivelse, så resultatet samsvarer med det du ville fått ved å klikke «Lagre som PDF» i Word – skrifter innebygd, layout bevart, ingen overraskelser.

Andre formater verdt å kjenne til

  • PDF til HTML når du vil ha en nettside. PDF til HTML bevarer ekte <table>-elementer og overskrifter, slik at resultatet blir lesbar HTML, ikke et skjermbilde pakket inn i markup.
  • PDF til Excel når PDF-en stort sett er tabeller. PDF til Excel trekker ut hver tabell til sitt eget ark med låste overskrifter.
  • PDF til CSV for rå tabelldata som du skal importere et annet sted. PDF til CSV pakker én CSV per tabell i en zip-fil.
  • PDF til bilder når du trenger hver side som en PNG – for eksempel til en presentasjon eller en portefølje. PDF til bilder gjengir med 200 DPI som standard.

Når du bør gi opp konvertering og bare sende PDF-en

Hvis mottakeren bare trenger å lese eller skrive ut PDF-en, ikke konverter den. Komprimer den med PDF-komprimering i stedet, og send PDF-en direkte. Konvertering er for når du trenger å redigere; gjør du ikke det, legger du bare til et ekstra trinn som kan svekke kvaliteten.

Du liker kanskje også