il est possible d'extraire le texte d'une image à l'aide d'un logiciel OCR (Optical character recognition ) ou encore appelé en français reconnaissance optique de caractères, Celui-ci permet de récupérer le texte dans l'image d'un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte.
Un système OCR part de l'image numérique réalisée par un scanner optique d'une page (document imprimé, feuillet dactylographié, etc...), ou une caméra numérique, et produit en sortie un fichier texte en divers formats (texte simple, formats de traitements de texte, XML...).
Certains logiciels d'OCR sont payant et d'autre sont gratuit, prenons l'exemple de Free Online OCR qui est l'un des sites de reconnaissance de caractères permettent d’extraire en quelques clics le texte ou les tableaux issus d’une image, peu importe son format.
1- Accéder au site .
2- Au niveau du formulaire en haut de page, sélectionnez le fichier à scanner
3- Sélectionnez le format de sortie (Word pour du texte, Excel pour un tableau), puis validez avec le bouton « Convert ».
Le site affiche ensuite clairement la progression jusqu’à vous délivrer un fichier au clic sur le bouton « Download ».
Vous aurez comme résultat un fichier qui est converti dans un format texte exploitable. À noter que la reconnaissance des tableaux reste encore imparfaite et peut nécessiter une vérification des chiffres récupérés.