OCR-tolka bilder och skärmbilder: dra ut text ur valfri bild
Ett foto av en meny på ett annat språk, en skannad skattedeklaration, en skärmbild av ett långt felmeddelande – OCR förvandlar alla dessa till markerbar, sökbar och redigerbar text. Här får du veta när du ska använda vilken OCR-variant.
OCR — optisk teckenigenkänning — är tekniken som förvandlar en bild av text till faktisk text. Förr var den långsam, felbenägen och anpassad för rena skanningar med svart text på vit bakgrund. Modern OCR klarar skärmbilder, mobilfoton, flerspråkiga menyer, handskrivna anteckningar och blekta kvitton. Det intressanta är inte om man ska använda OCR — utan vilket OCR-läge man ska använda, eftersom fel val är den vanligaste anledningen till att folk får dåliga resultat.
De fem vanliga situationerna och rätt verktyg för var och en
1. En skärmbild, och du vill ha den rena texten
Felmeddelanden, kodsnuttar, chattloggar — du vill ha texten, du bryr dig inte om formateringen. Använd bild till text och klistra in resultatet. Fungerar på skärmdumpar i mörkt läge, suddiga mobilfoton av laptopskärmar, allt du kan läsa.
2. Ett foto av en tabell
Mobilfoto av ett utskrivet kalkylblad, skärmdump av en webbtabell, skanning av en utskriven rapport. Använd inte OCR för ren text – kolumnerna kollapsar. Använd bild till Excel för ett formaterat kalkylblad, eller bild till CSV för rådata. Båda identifierar tabellrutnätet och bevarar rader och kolumner.
Om fotot redan är en ren skärmdump av en tabell ger bild till HTML dig riktiga <table>-element som du kan lägga in på en webbsida eller konvertera vidare med tabell till JSON.
3. Ett foto av ett dokument med rubriker och struktur
Tidningsartikel, tryckt rapport, flersidigt avtal. OCR med ren text förlorar strukturen. Använd bild till Word eller bild till Markdown. Word ger dig en .docx som du kan redigera vidare; Markdown är bättre om texten ska till en wiki, README eller anteckningsapp.
4. Text på ett språk du inte kan läsa
Ett foto av en meny i Tokyo, en skylt i Kairo, en etikett i Stockholm. Kör inte OCR och översätt sedan manuellt – använd bildöversättaren som kombinerar OCR + översättning i ett steg. Den ger originaltexten, översättningen och känner igen ~60 språk.
5. Handskrivna anteckningar
Foton av whiteboardtavlor, dagbokssidor, föreläsningsanteckningar. Generell OCR misslyckas med skrivstil — använd handstils-OCR som är inställd för sammanhängande, slarvig, äkta mänsklig handstil. Fungerar bäst på mörkt bläck på vanligt papper; ju mer kontrast, desto bättre resultat.
Ett specialfall: skannade PDF:er som behöver förbli PDF:er
Om du har en inskannad PDF som du vill behålla som PDF men göra sökbar – säg ett inskannat avtal där du behöver söka efter en klausul – konvertera den inte till Word. Använd sökbar PDF: den lägger till ett dolt textlager över bilden så att PDF:en fortfarande ser ut som en skanning men Ctrl-F och PDF-sökning fungerar. Detta gör också att du kan komprimera bildlagret aggressivt efteråt utan att förlora texten.
Få bättre OCR-resultat: tre regler
- Kontrast är A och O. Svart bläck på vit bakgrund läses nästan perfekt. Blekt bläck, rörig bakgrund och mönstrat papper försämrar resultatet. Om du styr fotot, ta det i jämnt, plant ljus med dokumentet som fyller bildrutan.
- Rakt slår snett. OCR-motorer rättar automatiskt till lätt skevhet, men lutande bilder (tagna tvärs över ett skrivbord) tappar exakthet. Håll kameran parallellt med sidan.
- Upplösning spelar roll upp till en viss gräns. Cirka 300 DPI är den optimala nivån – det motsvarar en 2000 pixlar bred bild av en A4-sida. Högre upplösning gör OCR långsammare utan att göra den mer exakt.
Specialiserad OCR som du kanske inte visste fanns
- Kvitton – extrahera leverantör, totalsumma, moms, datum och artikelrader som JSON med kvittoextraktor. Byggd specifikt för utläggsrapporter och bokföring.
- Visitkort – skapa ett vCard som är redo att importera till Kontakter med visitkortsskanner. Stoppar konferenskorthögen från att samla damm på ditt skrivbord.
OCR är ett av de mest effektiva verktygen i din verktygslåda — fem minuters läsning av ett foto kan bli fem sekunder. Välj rätt läge för situationen så blir resultatet rent redigerbart på första försöket.
Pixoate