OCR

OCR voor afbeeldingen en schermafbeeldingen: haal tekst uit elke afbeelding

Een foto van een menu in een andere taal, een gescand belastingformulier, een schermafbeelding van een lange foutmelding — OCR zet dit allemaal om in selecteerbare, doorzoekbare en bewerkbare tekst. Hier lees je wanneer je welke OCR-variant gebruikt.

Pixoate-team6 min lezen

OCR — optical character recognition — is de technologie die een afbeelding van tekst omzet in echte tekst. Vroeger was het traag, foutgevoelig en afgestemd op schone zwart-op-witte scans. Moderne OCR kan overweg met schermafbeeldingen, telefoonfoto's, meertalige menu's, handgeschreven notities en vervaagde kassabonnen. Het interessante is niet óf je OCR gebruikt, maar wélke OCR-modus, want de verkeerde kiezen is de meest voorkomende reden waarom mensen slechte resultaten krijgen.

De vijf veelvoorkomende situaties en de juiste tool voor elk

1. Een schermafbeelding waarvan je de platte tekst wilt

Foutmeldingen, codefragmenten, chatlogs — je wilt de tekst, de opmaak boeit je niet. Gebruik afbeelding naar tekst en plak het resultaat. Werkt op screenshots in donkere modus, wazige telefoonfoto's van laptopschermen, alles wat je kunt lezen.

2. Een foto van een tabel

Telefoonfoto van een geprinte spreadsheet, screenshot van een webtabel, scan van een geprint rapport. Gebruik geen platte-tekst-OCR — de kolommen lopen dan in elkaar. Gebruik afbeelding naar Excel voor een opgemaakte spreadsheet, of afbeelding naar CSV voor ruwe data. Beide herkennen het tabelraster en behouden rijen en kolommen.

Als de foto al een nette screenshot van een tabel is, geeft afbeelding naar HTML je echte <table>-elementen die je in een webpagina kunt plaatsen of verder kunt converteren met tabel naar JSON.

3. Een foto van een document met koppen en structuur

Tijdschriftartikel, gedrukt rapport, contract van meerdere pagina's. OCR met platte tekst verliest de structuur. Gebruik afbeelding naar Word of afbeelding naar Markdown. Word geeft je een .docx die je verder kunt bewerken; Markdown is beter als de tekst naar een wiki, README of notitie-app gaat.

4. Tekst in een taal die je niet kunt lezen

Een foto van een menu in Tokio, een bord in Caïro, een etiket in Stockholm. Doe geen OCR om vervolgens handmatig te vertalen — gebruik de afbeeldingsvertaler die OCR + vertaling in één stap combineert. Levert de oorspronkelijke tekst en de vertaling op en herkent ~60 talen.

5. Handgeschreven notities

Whiteboardfoto's, dagboekpagina's, collegeaantekeningen. Algemene OCR faalt op verbonden schrift — gebruik OCR voor handschrift, dat is afgestemd op aaneengeschreven, slordig, echt menselijk handschrift. Werkt het beste met donkere inkt op effen papier; hoe meer contrast, hoe beter het resultaat.

Eén bijzonder geval: gescande PDF's die PDF moeten blijven

Als je een gescande PDF hebt die je als PDF wilt houden maar doorzoekbaar wilt maken — stel, een gescand contract waarin je naar een clausule moet zoeken — converteer hem dan niet naar Word. Gebruik doorzoekbare PDF: dit voegt een verborgen tekstlaag over de afbeelding toe, zodat de PDF er nog steeds als een scan uitziet, maar Ctrl-F en PDF-zoeken werken. Hierdoor kun je de afbeeldingslaag achteraf ook agressief comprimeren zonder de tekst te verliezen.

Betere OCR-resultaten: drie regels

  1. Contrast is koning. Zwarte inkt op een witte achtergrond wordt vrijwel perfect gelezen. Vervaagde inkt, drukke achtergronden en papier met patronen werken allemaal averechts. Als je de foto zelf kunt maken, doe dat dan in vlak, gelijkmatig licht met het document beeldvullend.
  2. Recht wint van scheef. OCR-engines corrigeren lichte scheefstand automatisch, maar gekantelde opnamen (van de overkant van een bureau gemaakt) verliezen nauwkeurigheid. Houd de camera parallel aan de pagina.
  3. Resolutie is tot op zekere hoogte belangrijk. Het equivalent van ongeveer 300 DPI is het ideale punt — dat is een afbeelding van 2000 pixels van een A4-pagina. Een hogere resolutie maakt OCR trager zonder het nauwkeuriger te maken.

Gespecialiseerde OCR waarvan je misschien niet wist dat hij bestond

  • Bonnen — haal met bonnenextractor leverancier, totaal, btw, datum en regelposten als JSON eruit. Speciaal gebouwd voor onkostendeclaraties en boekhouding.
  • Visitekaartjes — genereer met visitekaartjesscanner een vCard die klaar is om te importeren in Contacten. Voorkomt dat de stapel beurskaartjes op je bureau ligt te verstoffen.

OCR is een van de meest waardevolle tools in je gereedschapskist: vijf minuten een foto overtypen kan vijf seconden worden. Kies de juiste modus voor de situatie en de resultaten zijn meteen netjes bewerkbaar.

Misschien vind je dit ook leuk