Reconnaissance de caractères

Vous voulez récupérer le texte d’un document papier sans avoir à tout ressaisir. Les outils de reconnaissance de caractères sont là pour vous faciliter la tâche. Les scanners sont parfois fournis avec un logiciel OCR. Si ce n’est pas le cas, Google Drive est fait pour vous.

La reconnaissance optique de caractères  (OCR optical character recognition) désigne les procédés informatiques pour la traduction d’images de textes imprimés ou dactylographiés en fichiers de texte. (Source : Wikipedia – Reconnaissance optique de caractères)

Procédure

  1. Scannez le document au format pdf. Utilisez une résolution de 300 voir 600 ppp pour obtenir une image assez précise. Plus l’image sera nette, meilleure sera la restitution du texte.

Le point par pouce (PPP) est une unité de précision communément utilisée pour définir la résolution d’un scanner (on parle de « finesse de numérisation »), d’une imprimante (on parle de « précision de l’impression ») ou d’une souris optique. Plus cette valeur est élevée, meilleure est la qualité. On peut également utiliser cette notion avec un moniteur d’ordinateur ou un écran de télévision, mais on utilisera alors le terme de PPI (pixels per inch, pixels par pouce, PPP également en français). (Source : Wikipedia – Point par pouce)

  1. Connectez-vous à Google Drive (vous devez disposer d’un compte Google).
  2. Cliquez sur le bouton Importer, puis sélectionnez Fichiers…

Importer un fichier dans Google Drive

  1. Sélectionnez le fichier que vous avez scanné puis cliquez sur le bouton Ouvrir.
  2. Le document est importé dans Google Drive

Google Drive importation terminée

  1. Dans la liste de vos fichiers Google Drive, cliquez sur le fichier que vous venez d’importer. Cliquez sur le bouton Ouvrir en bas de l’aperçu.

Google Drive ouvrir un fichier

  1. Pour enregistrer le contenu du document dans un format texte, cliquez dans le menu Fichier > Ouvrir avec > Google Documents.

Google Drive document texte

Le nouveau document contient à la fois les images du document scanné et la transcription du texte. Faites défiler le document pour accéder au texte qui se situe généralement sur une deuxième page.