OCR di immagini e screenshot: estrai il testo da qualsiasi immagine
La foto di un menu in un'altra lingua, un modulo fiscale scansionato, lo screenshot di un lungo messaggio di errore — l'OCR trasforma tutto questo in testo selezionabile, ricercabile e modificabile. Ecco quando usare ciascun tipo di OCR.
L'OCR — riconoscimento ottico dei caratteri — è la tecnologia che trasforma l'immagine di un testo in testo vero e proprio. Un tempo era lento, soggetto a errori e calibrato per scansioni pulite in nero su bianco. L'OCR moderno gestisce screenshot, foto da smartphone, menu multilingue, appunti scritti a mano e scontrini sbiaditi. La parte interessante non è se usare l'OCR, ma quale modalità OCR usare, perché scegliere quella sbagliata è il motivo più comune per cui si ottengono risultati scadenti.
Le cinque situazioni più comuni e lo strumento giusto per ciascuna
1. Uno screenshot, e vuoi il testo semplice
Messaggi di errore, snippet di codice, log di chat: vuoi il testo e la formattazione non ti interessa. Usa da immagine a testo e incolla il risultato. Funziona con screenshot in modalità scura, foto sfocate di schermi di laptop scattate col telefono, qualsiasi cosa tu riesca a leggere.
2. La foto di una tabella
Foto da telefono di un foglio di calcolo stampato, screenshot di una tabella web, scansione di un report stampato. Non usare l'OCR a testo semplice: le colonne andranno perse. Usa image to Excel per un foglio di calcolo formattato, oppure image to CSV per i dati grezzi. Entrambi rilevano la griglia della tabella e preservano righe e colonne.
Se la foto è già uno screenshot pulito di una tabella, da immagine a HTML ti restituisce veri elementi <table> che puoi inserire in una pagina web o convertire ulteriormente con da tabella a JSON.
3. La foto di un documento con titoli e struttura
Articolo di rivista, report stampato, contratto multipagina. L'OCR a testo semplice perde la struttura. Usa immagine a Word o immagine a Markdown. Word ti dà un file .docx che puoi modificare ulteriormente; Markdown è preferibile se il testo è destinato a un wiki, a un README o a un'app di note.
4. Testo in una lingua che non sai leggere
La foto di un menu a Tokyo, un cartello al Cairo, un'etichetta a Stoccolma. Non fare prima l'OCR e poi la traduzione a mano — usa il traduttore di immagini che combina OCR + traduzione in un solo passaggio. Restituisce il testo originale, la traduzione e riconosce circa 60 lingue.
5. Appunti scritti a mano
Foto di lavagne, pagine di diario, appunti di lezione. L'OCR generico fallisce sul corsivo: usa l'OCR per scrittura a mano, ottimizzato per la scrittura a mano reale, legata e disordinata. Funziona meglio con inchiostro scuro su carta semplice; più contrasto c'è, migliore è il risultato.
Un caso particolare: i PDF scansionati che devono restare PDF
Se hai un PDF scansionato che vuoi mantenere come PDF ma rendere ricercabile — poniamo, un contratto scansionato in cui devi cercare una clausola — non convertirlo in Word. Usa PDF ricercabile: aggiunge un livello di testo nascosto sopra l'immagine, così il PDF sembra ancora una scansione ma Ctrl-F e la ricerca nel PDF funzionano. Questo ti permette anche di comprimere in modo aggressivo il livello immagine in seguito, senza perdere il testo.
Ottieni risultati OCR migliori: tre regole
- Il contrasto è fondamentale. Inchiostro nero su sfondo bianco viene letto quasi perfettamente. Inchiostro sbiadito, sfondi confusi e carta con motivi peggiorano i risultati. Se puoi controllare la foto, scattala con luce piatta e uniforme, con il documento che riempie l'inquadratura.
- Dritto è meglio di storto. I motori OCR correggono automaticamente le lievi inclinazioni, ma gli scatti inclinati (presi dall'altro lato della scrivania) perdono precisione. Tieni la fotocamera parallela alla pagina.
- La risoluzione conta fino a un certo punto. L'equivalente di circa 300 DPI è il punto ideale — cioè un'immagine da 2000 pixel di una pagina A4. Una risoluzione più alta rende l'OCR più lento senza renderlo più accurato.
OCR specializzati di cui forse non conoscevi l'esistenza
- Scontrini — estrai fornitore, totale, imposta, data e voci come JSON con l'estrattore di scontrini. Creato appositamente per le note spese e la contabilità.
- Biglietti da visita — genera una vCard pronta da importare nei Contatti con lo scanner per biglietti da visita. Evita che la pila di biglietti raccolti alle conferenze marcisca sulla scrivania.
L'OCR è uno degli strumenti più potenti che puoi avere a disposizione: cinque minuti passati a leggere una foto possono diventare cinque secondi. Scegli la modalità giusta per la situazione e i risultati saranno perfettamente modificabili al primo tentativo.
Pixoate