pdf

PDF Wordiksi: mikä muunnostyökalu todella säilyttää muotoilusi?

Useimmat PDF–Word-muuntimet pilaavat taulukot, sekoittavat fontit tai jättävät kuvat kokonaan pois. Tässä kerromme, mikä tekee hyvän muuntimen, miksi skannatut PDF-tiedostot tarvitsevat OCR:ää ja miten käsitellä jokaista PDF-tyyppiä.

Pixoate-tiimi8 min lukuaika

PDF suunniteltiin näyttämään samanlaiselta jokaisella laitteella. Se on sen suuri vahvuus ja syy siihen, miksi sitä on ärsyttävää muokata. Kun muunnat PDF:n Wordiksi, pyydät työkalua takaisinmallintamaan asiakirjan – selvittämään, mitkä merkit kuuluvat mihinkin kappaleeseen, missä taulukot ovat, mitkä ovat otsikoita ja mikä on alaviite ja mikä ei. Jotkin muuntimet tekevät tämän hyvin. Useimmat tekevät sen huonosti.

Tässä on nopea päätöspuu ja mikä tekee muuntimesta oikeasti hyvän.

Ensimmäinen kysymys: onko PDF aito PDF vai skannaus?

Jos voit valita tekstin hiirellä PDF-lukijassa, kyseessä on aito PDF, jossa on todellista tekstisisältöä. Jos et voi – jos teksti käyttäytyy kuin kuva – kyseessä on skannaus, vaikka se ei siltä näyttäisikään. Muunnospolku on täysin erilainen.

Aidoille PDF-tiedostoille

PDF Wordiksi lukee upotetun tekstin ja asettelun ja rakentaa sen sitten uudelleen .docx-tiedostoksi. Hyvät muuntimet säilyttävät kappaleet, otsikot, luettelot, yksinkertaiset taulukot ja tekstin sisäiset kuvat. Tavanomaiset toimistoasiakirjat tulevat ulos siististi muokattavina.

Skannatuille PDF-tiedostoille

Tarvitset ensin OCR:n. PDF tekstiksi OCR käytössä antaa sinulle raakatekstin; muotoiltua, rakenteellista asiakirjaa varten käytä kuvasta Wordiksi jokaisella sivulla (tai aja koko PDF läpi). Tulos ei näytä täysin samalta kuin skannaus, mutta teksti on muokattavissa ja rakenne säilyy.

Missä muuntimet menevät pieleen

Klassiset epäonnistumiset, suunnilleen siinä järjestyksessä kuin ne tapahtuvat:

  • Taulukot muuttuvat tekstilaatikoiksi. Huonot muuntimet tekevät jokaisesta solusta kelluvan elementin. Taulukko näyttää oikealta; et oikeasti pysty muokkaamaan sitä taulukkona.
  • Monipalstaiset asettelut hajoavat. Kaksipalstaisesta uutiskirjeestä tulee yksi palsta, jossa molempien palstojen teksti lomittuu kömpelösti.
  • Fontit korvataan huomaamatta. Jos PDF:ssäsi käytetään fonttia, jota Wordista ei löydy, saat jotain lähes vastaavaa — mutta ei samaa — ja rivinvaihtosi siirtyvät.
  • Alaviitteet irtoavat. Alaviitteen teksti päätyy irralliseksi kappaleeksi sivun alalaitaan, eikä se ole enää sidottu viitemerkkiin.
  • Ylä- ja alatunnisteet muuttuvat leipätekstiksi. Sivunumerot, ylätunnisteet ja alatunnisteet päätyvät kappaleiksi keskelle tekstivirtaa.

Mitä hyvä muunnin tekee

Rima on tunnistettava asettelu, muokattavat taulukot, säilyvät listat ja kuvat, jotka pysyvät siellä mihin ne laitoit. Pixoaten PDF Word-muotoon ylittää tämän riman useimmissa toimistotyylisissä PDF:issä: sopimukset, raportit, lomakkeet, kirjeet. Se käyttää asettelutietoista käsittelyä, joka tunnistaa taulukkoruudukot ja rakentaa ne aitoina Word-taulukoina, ei tekstilaatikoina. Otsikot säilyttävät hierarkiansa. Luettelo- ja numerolistat tulevat läpi listoina, eivät tekstiriveinä jotka näyttävät listoilta.

Toiseen suuntaan

Jos luot PDF:n Word-dokumentista (ja haluat sen näyttävän täsmälleen samalta kuin Wordissa), käytä työkalua Word PDF:ksi. Se suorittaa aidon LibreOffice-renderöinnin, joten tulos vastaa sitä, minkä saisit napsauttamalla "Tallenna PDF-muodossa" Wordissa – fontit upotettuna, asettelu säilytettynä, ilman yllätyksiä.

Muita tietämisen arvoisia muotoja

  • PDF HTML:ksi, kun haluat verkkosivun. PDF HTML:ksi säilyttää aidot <table>-elementit ja otsikot, joten tuloksena on luettavaa HTML:ää, ei merkkauksen sisään kääritty kuvakaappaus.
  • PDF Exceliksi, kun PDF koostuu pääosin taulukoista. PDF Exceliksi poimii jokaisen taulukon omalle taulukkovälilehdelleen kiinnitetyin otsikkoriveineen.
  • PDF CSV:ksi raakaa taulukkodataa varten, jonka tuot muualle. PDF CSV:ksi pakkaa yhden CSV-tiedoston taulukkoa kohden.
  • PDF kuviksi, kun tarvitset jokaisen sivun PNG-muodossa — vaikkapa diaesitykseen tai portfolioon. PDF kuviksi renderöi oletuksena 200 DPI:n tarkkuudella.

Milloin kannattaa luopua muuntamisesta ja lähettää vain PDF

Jos vastaanottajan tarvitsee vain lukea tai tulostaa PDF, älä muunna sitä. Pakkaa se sen sijaan työkalulla PDF-pakkaus ja lähetä PDF suoraan. Muuntaminen on tarkoitettu tilanteisiin, joissa sinun on muokattava; jos ei tarvitse, lisäät vain vaiheen, joka voi heikentää laatua.

Saatat pitää myös näistä