bibliothèques de reconnaissance optique de caractères Tesseract offrent aux développeurs une méthode pour numériser des documents et du texte à une image. Vous utilisez les bibliothèques Tesseract pour stocker des images de documents que vous n'avez plus besoin de papier. Vous utilisez des bibliothèques Tesseract en Java avec une boucle à travers chaque personnage et en écrivant le caractère d' un fichier. Pour utiliser les bibliothèques , vous devez inclure l'espace de noms Java pour les fonctions OCR. Instructions
1
clic droit sur le fichier Java que vous voulez utiliser pour créer le document OCR . Cliquez sur " Ouvrir avec " et sélectionner votre éditeur de Java préféré .
2
Ajoutez l'espace de noms bibliothèque OCR au début du fichier . Copiez et collez le code suivant dans votre fichier de code source:
com.tplan.robot.imagecomparison.tesseractocr
3
créer le code qui scanne caractères du fichier. Par exemple, les boucles suivantes de code à travers chaque personnage dans un fichier et l'écrit dans un fichier image :
: Var lines = méthode 0Compareto = " tocr " cmparea = " x: 33 , y: 2, w : 200 , H: 22 " pour ( i = 1; {i } < { } lignes +1; i = {i} +1) { typeLine " { _TOCR_LINE {i} } "}
< br > 4
Cliquez sur le bouton "Enregistrer" de l'éditeur Java et cliquez sur "Exécuter " pour exécuter le code dans un débogueur Java.