MATLAB est un acronyme pour «matrice laboratoire» et fait référence à un langage de programmation de haut niveau et un environnement de programmation développé par The MathWorks société de logiciels informatiques techniques. OCR est l'abréviation de " reconnaissance optique de caractères " et se réfère au processus de lecture des données sous forme imprimée et en identifiant les modèles optiques qui correspondent à des lettres, des chiffres et autres caractères . OCR
Toutes les étapes OCR - segmentation, extraction caractéristiques et la classification - peut être implémentée en utilisant MATLAB. Segmentation, qui consiste à vérifier la connectivité des formes, l'étiquetage et les isoler , est l'étape la plus importante, car elle permet au programme OCR pour extraire les caractéristiques de chaque personnage individuel . La segmentation de texte manuscrit est particulièrement difficile en raison des caractères manuscrits ont tendance à être reliée à l'autre . Extraction de caractéristiques extrait les caractéristiques les plus utiles , en termes de reconnaissance , de chaque personnage et classification attribue ces fonctionnalités pour les classes de personnages . Image libre de capture
Selon un document présenté lors d'un séminaire donné par le Laboratoire Lasin de Synergetics à l'Université de Ljubljana , OCR peut être implémenté dans MATLAB en utilisant la boîte à outils de réseau neuronal et de l'image Toolbox add-ons. La première étape consiste à lire l'image dans l'espace de travail MATLAB comme un fichier bitmap. Il s'agit d'un type de fichier graphique dans laquelle chaque élément d'image , ou pixel , correspond à un ou plusieurs chiffres binaires , ou bits, dans la mémoire. Le code suivant est utilisé pour cette tâche
I = imread (' training.bmp '); . Imshow (I)
Image de conversion
la prochaine étape est de convertir l' image en couleur , qui est stocké comme distinct de couleur rouge , vert et bleu superpositions , en une image en niveaux de gris , qui se compose de teintes discrètes de gris. Le code MATLAB suivant convertit l'image RVB en une image en niveaux de gris
Igray = rgb2gray (I); . Imshow ( Igray )
battage
la suite , une technique appelée " battage " est utilisé pour convertir l'image en niveaux de gris en une image binaire . La cellule de codes MATLAB nécessaires pour convertir l' image en niveaux de gris d'une image binaire ressemble à ceci :
PCI = im2bw ( Igray , graythresh ( Igray ) ) ; imshow ( IBW )
< br > Détection de contour
Une fois l'image binaire est créé, les caractères individuels sont cultivés en sous-images . Ceux-ci fournissent les données brutes pour la routine d'extraction des caractéristiques . Les sous-images doivent être recadrées fortement à la frontière de chaque personnage , si elles doivent être de taille standard, ainsi détecter le bord de chaque personnage est important. Le bord d'une image peut être détecté en utilisant le code suivant MATLAB
iEDGE = bord ( uint8 ( IBW ) ) ; . Imshow ( iEdge )
Objets
.
Tous les objets dans une image - et les propriétés de chaque objet - peut être déterminée en utilisant le code suivant MATLAB
[ Ilabel nb] = bwlabel ( Ifill ) ; disp ( num) ; Iprops = regionprops ( Ilabel ) ; Ibox = [ Iprops.BoundingBox ] ; Ibox = remodeler ( Ibox , [4 50] ) ; imshow (I)