ocr

OCR d'images et de captures d'écran : extrayez le texte de n'importe quelle image

La photo d'un menu dans une autre langue, un formulaire fiscal numérisé, la capture d'écran d'un long message d'erreur — l'OCR transforme tout cela en texte sélectionnable, recherchable et modifiable. Voici quel type d'OCR utiliser et quand.

L’équipe Pixoate6 min de lecture

L'OCR — reconnaissance optique de caractères — est la technologie qui transforme l'image d'un texte en texte réel. Autrefois lente, sujette aux erreurs et calibrée pour des numérisations propres en noir sur blanc, l'OCR moderne gère les captures d'écran, les photos prises au téléphone, les menus multilingues, les notes manuscrites et les reçus délavés. L'enjeu n'est pas de savoir s'il faut utiliser l'OCR, mais quel mode OCR choisir, car un mauvais choix est la cause la plus fréquente de résultats décevants.

Les cinq situations courantes et le bon outil pour chacune

1. Une capture d'écran, et vous voulez en extraire le texte brut

Messages d'erreur, extraits de code, journaux de discussion — vous voulez le texte, peu importe la mise en forme. Utilisez image vers texte et collez le résultat. Cela fonctionne sur les captures d'écran en mode sombre, les photos floues d'écrans d'ordinateur prises au téléphone, tout ce que vous pouvez lire.

2. Une photo d'un tableau

Photo d’un tableur imprimé prise au téléphone, capture d’écran d’un tableau web, scan d’un rapport imprimé. N’utilisez pas l’OCR en texte brut : les colonnes s’effondreront. Utilisez image vers Excel pour un tableur mis en forme, ou image vers CSV pour des données brutes. Les deux détectent la grille du tableau et préservent les lignes et les colonnes.

Si la photo est déjà une capture d'écran nette d'un tableau, image vers HTML vous fournit de véritables éléments <table> que vous pouvez intégrer dans une page web ou convertir davantage avec tableau vers JSON.

3. Une photo d'un document avec des titres et une structure

Article de magazine, rapport imprimé, contrat de plusieurs pages. L'OCR en texte brut perd la structure. Utilisez image vers Word ou image vers Markdown. Word vous donne un .docx que vous pouvez encore modifier ; le Markdown est préférable si le texte est destiné à un wiki, un README ou une application de notes.

4. Du texte dans une langue que vous ne savez pas lire

La photo d'un menu à Tokyo, d'un panneau au Caire, d'une étiquette à Stockholm. Ne faites pas d'OCR pour ensuite traduire à la main — utilisez le traducteur d'images qui combine OCR et traduction en une seule étape. Il restitue le texte d'origine, sa traduction et reconnaît environ 60 langues.

5. Notes manuscrites

Photos de tableaux blancs, pages de journal, notes de cours. L'OCR générique échoue sur l'écriture cursive : utilisez l'OCR pour écriture manuscrite, optimisé pour l'écriture liée, brouillonne, bien humaine. Les meilleurs résultats s'obtiennent avec de l'encre foncée sur du papier uni ; plus le contraste est élevé, meilleur est le résultat.

Un cas particulier : les PDF numérisés qui doivent rester des PDF

Si vous avez un PDF numérisé que vous souhaitez conserver au format PDF tout en le rendant interrogeable — par exemple, un contrat numérisé dans lequel vous devez rechercher une clause — ne le convertissez pas en Word. Utilisez le PDF interrogeable : il ajoute une couche de texte masquée par-dessus l'image, si bien que le PDF ressemble toujours à un document numérisé tout en permettant la recherche avec Ctrl-F et la recherche PDF. Cela vous permet aussi de compresser ensuite la couche d'image de manière agressive sans perdre le texte.

Obtenez de meilleurs résultats OCR : trois règles

  1. Le contraste est roi. De l'encre noire sur un fond blanc se lit presque parfaitement. Une encre pâlie, des fonds chargés et du papier à motifs nuisent tous au résultat. Si vous maîtrisez la prise de vue, photographiez avec une lumière plate et uniforme, le document occupant tout le cadre.
  2. Droit vaut mieux que de travers. Les moteurs d'OCR corrigent automatiquement un léger biais, mais les prises de vue inclinées (faites de l'autre bout d'un bureau) perdent en précision. Tenez l'appareil photo parallèle à la page.
  3. La résolution compte jusqu'à un certain point. L'équivalent d'environ 300 DPI est le point idéal — soit une image de 2000 pixels pour une page A4. Une résolution plus élevée ralentit l'OCR sans le rendre plus précis.

Des outils OCR spécialisés dont vous ignoriez peut-être l'existence

  • Reçus — extrayez le commerçant, le total, la taxe, la date et les lignes d'articles au format JSON avec l'extracteur de reçus. Conçu spécialement pour les notes de frais et la comptabilité.
  • Cartes de visite — générez une vCard prête à importer dans vos contacts avec le scanner de cartes de visite. De quoi éviter que la pile de cartes de conférence ne moisisse sur votre bureau.

L'OCR est l'un des outils les plus rentables de votre arsenal : cinq minutes passées à lire une photo peuvent se réduire à cinq secondes. Choisissez le bon mode selon la situation et vous obtenez du premier coup des résultats propres et facilement modifiables.

Vous aimerez peut-être aussi