? La possibilité de numériser un document sous forme lisible par machine est un gain de temps incomparable . Plutôt que de retaper le document , et peut-être d'insérer des erreurs de vos propres, il numérisation et la transmission de l'image numérisée via un lecteur logiciel peut entraîner un document éditable avec un haut degré de précision par rapport à l'original. Ce processus est appelé logiciel de reconnaissance optique . Reconnaissance
reconnaissance optique de caractères optique de caractères ( OCR ) est un processus dans lequel le texte imprimé ou manuscrit est mécaniquement ou électroniquement lu et converti en une forme reconnue par un ordinateur. Le processus sophistiqué considère les formes de lettres et les compare à une bibliothèque de formes similaires. Quand une correspondance est faite , un caractère représentant le motif est affiché sur l'écran , ou inscrit dans un fichier informatique . OCR permet à un document à numériser et lu par un ordinateur , en créant un fichier qui peut être édité ou sollicité par d'autres moyens .
OCR Software
Les logiciels informatiques sont utilisés pour la mise en œuvre OCR moderne. Le logiciel a évolué depuis ses débuts , dans lequel les programmes devaient être calibré pour chaque police unique, il devait reconnaître . Il est disponible sous forme autonome comme un programme spécialement créé pour cette tâche , et en tant que composant logiciel de numérisation. L'avènement de l' Internet et l'informatique en nuage a conduit à l'élaboration de programmes d'OCR basé sur le Web , ce qui élimine la nécessité pour les installations de bureau ou un serveur individuel.
Le Processus de reconnaissance
< br >
OCR fonctions logicielles de premier reconnaissant la distinction entre les zones claires et sombres de l' image numérisée. Comme il découvre une distinction clair-obscur , le logiciel recherche des modèles reconnaissables , comme les lignes verticales et horizontales , ainsi que des courbes connectées ou partielle. Si l'on peut reconnaître un motif comme une lettre ou un autre caractère , il cherche sa base de données pour le caractère correspondant dans le jeu de langage de l'ordinateur. Il passe ensuite ce personnage sur le document ou l'affichage , il est l'assemblage . Si le logiciel est incapable de reconnaître un caractère, il peut faire sa meilleure estimation ou remplacer un caractère alternatif afin de maintenir le processus .
Problèmes potentiels avec OCR Software
< p> Depuis logiciel OCR repose sur la reconnaissance de formes , un artefact sur la page qui pourrait potentiellement affecter ce processus est une source de problèmes . OCR fonctionne mieux quand il ya une distinction claire entre les caractères et le fond du document, idéalement noir sur blanc. Arrière-plans colorés ou occupé qui rendent les modèles moins distinctifs peuvent causer des problèmes . Taches , les plis et autres dommages au document peuvent entraîner une reconnaissance de caractères incorrects ainsi .