pdf

PDF in Word: quale strumento di conversione mantiene davvero la tua formattazione?

La maggior parte dei convertitori da PDF a Word distrugge le tabelle, scompiglia i font o salta del tutto le immagini. Ecco cosa rende valido un convertitore, perché i PDF scansionati hanno bisogno dell'OCR e come gestire ogni tipo di PDF.

Team Pixoate8 min di lettura

Il PDF è stato progettato per apparire identico su ogni dispositivo. È questo il suo grande punto di forza e il motivo per cui è fastidioso da modificare. Quando converti un PDF in Word, chiedi a uno strumento di decodificare il documento — capire quali caratteri appartengono a quale paragrafo, dove si trovano le tabelle, quali sono i titoli, cosa è una nota a piè di pagina e cosa no. Alcuni convertitori lo fanno bene. La maggior parte lo fa male.

Ecco un rapido schema decisionale e cosa rende un convertitore davvero valido.

Prima domanda: il PDF è un vero PDF o una scansione?

Se riesci a selezionare il testo con il mouse all'interno del lettore PDF, è un vero PDF con contenuto testuale reale. Se non ci riesci — se il testo si comporta come un'immagine — allora è una scansione, anche se non sembra. Il percorso di conversione è completamente diverso.

Per i PDF reali

Da PDF a Word legge il testo e il layout incorporati, poi li ricostruisce come file .docx. I buoni convertitori preservano paragrafi, intestazioni, elenchi, tabelle semplici e immagini in linea. I comuni documenti d'ufficio vengono restituiti puliti e modificabili.

Per i PDF scansionati

Prima ti serve l'OCR. Da PDF a testo con l'OCR abilitato ti fornisce il testo grezzo; per un documento strutturato con formattazione, usa da immagine a Word su ogni pagina (oppure elabora l'intero PDF). Il risultato non sarà identico alla scansione, ma il testo sarà modificabile e la struttura verrà preservata.

Cosa sbagliano i convertitori

Gli errori classici, più o meno nell'ordine in cui si verificano:

  • Le tabelle diventano caselle di testo. I convertitori scadenti trasformano ogni cella in un elemento fluttuante. La tabella sembra corretta, ma non puoi modificarla davvero come una tabella.
  • Le impaginazioni a più colonne collassano. Una newsletter a due colonne diventa una sola colonna, con il testo delle due colonne mescolato in modo confuso.
  • I font vengono sostituiti senza avvisare. Se il tuo PDF usa un font che Word non possiede, otterrai qualcosa di simile — ma non identico — e le interruzioni di riga si spostano.
  • Le note a piè di pagina si staccano. Il testo della nota finisce come un paragrafo vagante in fondo alla pagina, non più collegato al suo riferimento.
  • Intestazioni e piè di pagina diventano testo del corpo. Numeri di pagina, intestazioni e piè di pagina arrivano come paragrafi in mezzo al flusso del testo.

Cosa fa un buon convertitore

Lo standard è un layout riconoscibile, tabelle modificabili, liste preservate e immagini inline che restano dove le hai messe. Lo strumento PDF in Word di Pixoate raggiunge questo standard per la maggior parte dei PDF in stile ufficio: contratti, report, moduli, lettere. Utilizza una pipeline che riconosce il layout, rileva le griglie delle tabelle e le ricostruisce come tabelle native di Word, non come caselle di testo. Le intestazioni mantengono la loro gerarchia. Le liste puntate e numerate vengono restituite come liste, non come righe di testo che sembrano liste.

Il percorso inverso

Se stai generando un PDF da un documento Word (e vuoi che appaia esattamente come in Word), usa Word in PDF. Esegue un vero rendering con LibreOffice, così il risultato corrisponde a quello che otterresti cliccando "Salva come PDF" in Word — font incorporati, layout preservato, nessuna sorpresa.

Altri formati che vale la pena conoscere

  • Da PDF a HTML quando vuoi una pagina web. Da PDF a HTML preserva i veri elementi <table> e i titoli, così il risultato è HTML leggibile, non uno screenshot avvolto in codice.
  • Da PDF a Excel quando il PDF è composto principalmente da tabelle. Da PDF a Excel estrae ogni tabella in un foglio dedicato con intestazioni bloccate.
  • Da PDF a CSV per i dati grezzi delle tabelle che importerai altrove. Da PDF a CSV comprime in zip un CSV per ogni tabella.
  • Da PDF a immagini quando ti serve ogni pagina come PNG — ad esempio per una presentazione o un portfolio. Da PDF a immagini esegue il rendering a 200 DPI per impostazione predefinita.

Quando rinunciare alla conversione e inviare semplicemente il PDF

Se chi riceve il PDF deve solo leggerlo o stamparlo, non convertirlo. Comprimilo invece con comprimi PDF e invialo direttamente. La conversione serve quando devi modificare; se non ti serve, stai solo aggiungendo un passaggio che può ridurre la fedeltà.

Potrebbe interessarti anche