ocr

OCR kuville ja kuvakaappauksille: poimi teksti mistä tahansa kuvasta

Valokuva vieraskielisestä ruokalistasta, skannattu verolomake, kuvakaappaus pitkästä virheilmoituksesta — OCR muuntaa nämä kaikki valittavaksi, haettavaksi ja muokattavaksi tekstiksi. Tässä ohjeet siihen, milloin käyttää mitäkin OCR-tyyppiä.

Pixoate-tiimi6 min lukuaika

OCR — optinen tekstintunnistus — on teknologia, joka muuttaa tekstikuvan varsinaiseksi tekstiksi. Ennen se oli hidasta, virhealtista ja viritetty puhtaisiin mustavalkoisiin skannauksiin. Nykyaikainen OCR käsittelee kuvakaappauksia, puhelimen valokuvia, monikielisiä ruokalistoja, käsinkirjoitettuja muistiinpanoja ja haalistuneita kuitteja. Mielenkiintoisinta ei ole se, käytetäänkö OCR:ää — vaan mitä OCR-tilaa käytetään, sillä väärä valinta on yleisin syy huonoihin tuloksiin.

Viisi yleistä tilannetta ja oikea työkalu kuhunkin

1. Kuvakaappaus, ja haluat pelkän tekstin

Virheilmoitukset, koodinpätkät, chat-lokit — haluat tekstin, et välitä muotoilusta. Käytä kuvasta tekstiksi -työkalua ja liitä tulos. Toimii tumman tilan kuvakaappauksissa, sumeissa puhelinkuvissa kannettavan näytöstä — kaikessa minkä pystyt lukemaan.

2. Valokuva taulukosta

Puhelimella otettu kuva tulostetusta taulukosta, kuvakaappaus verkkotaulukosta, skannaus tulostetusta raportista. Älä käytä tavallista teksti-OCR:ää — sarakkeet romahtavat. Käytä kuvasta Exceliksi tyylitellyn taulukon luomiseen tai kuvasta CSV:ksi raakadatalle. Molemmat tunnistavat taulukon ruudukon ja säilyttävät rivit ja sarakkeet.

Jos kuva on jo siisti kuvakaappaus taulukosta, kuvasta HTML:ksi antaa sinulle aitoja <table>-elementtejä, jotka voit pudottaa verkkosivulle tai muuntaa edelleen työkalulla taulukosta JSON:iin.

3. Valokuva asiakirjasta, jossa on otsikoita ja rakenne

Aikakauslehtiartikkeli, tulostettu raportti, monisivuinen sopimus. Pelkän tekstin OCR menettää rakenteen. Käytä työkalua image to Word tai image to Markdown. Word antaa sinulle .docx-tiedoston, jota voit muokata edelleen; Markdown on parempi, jos teksti on menossa wikiin, README-tiedostoon tai muistiinpanosovellukseen.

4. Teksti kielellä, jota et osaa lukea

Valokuva ruokalistasta Tokiossa, kyltistä Kairossa, etiketistä Tukholmassa. Älä tee OCR:ää ja käännä sitten käsin — käytä kuvankääntäjää, joka yhdistää OCR:n ja käännöksen yhteen vaiheeseen. Tuottaa alkuperäisen tekstin, käännöksen ja tunnistaa noin 60 kieltä.

5. Käsinkirjoitetut muistiinpanot

Valkotaulukuvat, päiväkirjan sivut, luentomuistiinpanot. Yleinen OCR epäonnistuu kaunokirjoituksessa — käytä käsialan OCR:ää, joka on viritetty yhtenäiselle, epäsiistille, aidolle ihmiskäsialalle. Toimii parhaiten tummalla musteella tavallisella paperilla; mitä enemmän kontrastia, sitä parempi lopputulos.

Yksi erikoistapaus: skannatut PDF:t, joiden on pysyttävä PDF-muodossa

Jos sinulla on skannattu PDF, jonka haluat pitää PDF:nä mutta tehdä haettavaksi – vaikkapa skannattu sopimus, josta sinun on etsittävä tiettyä lauseketta – älä muunna sitä Wordiksi. Käytä työkalua haettava PDF: se lisää piilotetun tekstikerroksen kuvan päälle, jolloin PDF näyttää edelleen skannaukselta, mutta Ctrl-F ja PDF-haku toimivat. Tämän ansiosta voit myös pakata kuvakerroksen voimakkaasti jälkikäteen menettämättä tekstiä.

Saat parempia OCR-tuloksia: kolme sääntöä

  1. Kontrasti on kuningas. Musta muste valkoisella taustalla luetaan lähes täydellisesti. Haalistunut muste, sekavat taustat ja kuvioitu paperi kaikki haittaavat. Jos voit vaikuttaa kuvaan, ota se tasaisessa, pehmeässä valossa niin, että asiakirja täyttää kuvan.
  2. Suora voittaa vinon. OCR-moottorit korjaavat automaattisesti lievän vinouden, mutta kallistuneet otokset (otettu pöydän toiselta puolelta) menettävät tarkkuutta. Pidä kamera sivun suuntaisena.
  3. Tarkkuudella on väliä tiettyyn pisteeseen asti. Noin 300 DPI:tä vastaava on optimaalinen — se on 2000 pikselin kuva A4-sivusta. Korkeampi tarkkuus hidastaa OCR:ää tekemättä siitä tarkempaa.

Erikoistunut OCR, jonka olemassaolosta et ehkä tiennyt

  • Kuitit — poimi myyjä, summa, vero, päivämäärä ja rivierittelyt JSON-muodossa kuittien poimijalla. Rakennettu erityisesti kululaskelmia ja kirjanpitoa varten.
  • Käyntikortit — luo Yhteystietoihin tuotavaksi valmis vCard käyntikorttiskannerilla. Estää konferenssikorttipinon lojumasta pöydälläsi.

OCR on yksi työkalupakkisi tehokkaimmista työkaluista — viiden minuutin kuvan lukemisesta voi tulla viisi sekuntia. Valitse tilanteeseen oikea tila, niin tulokset ovat siististi muokattavissa heti ensimmäisellä yrityksellä.

Saatat pitää myös näistä