L'algorithme de Levenshtein , communément appelée distance d'édition , est le nombre minimum d'opérations d'édition nécessaires pour transformer une chaîne de données , la chaîne source , dans un autre, la chaîne cible . Des séquences de lettres ou de chiffres comprennent des chaînes de données . Opérations d'édition valides comprennent substitution, insertion ou suppression. Des programmes comme correcteur d'orthographe et des outils de correction automatique utilisent cet algorithme dans leur fonctionnement. Bien que le système de l'algorithme utilisé par les ordinateurs et les téléphones intelligents semble ardue à comprendre, le processus de base de la définition d'une distance d'édition est relativement simple. Instructions
1
écrire ou entrer vos deux cordes sur une page si la chaîne des sources est aligné au dessus de la chaîne cible . Par exemple:
chat (string source) sort ( chaîne cible )
2
identifier les points de données où une chaîne diffère de l'autre . Par exemple:
Cat (string source) sort ( chaîne cible )
Les lettres différer à la première place (C et F) , et la chaîne cible a un point de données supplémentaire (E) .
3
Appliquer le plus petit nombre d'opérations d'édition (insertion, suppression, substitution) possible de changer la chaîne source à la chaîne cible . Comptez les modifications. Par exemple:
Cat - > substitut F C et insert E -> sort
Le changement nécessite deux opérations d'édition , une substitution et une insertion, et ne peut être achevée en moins . Par conséquent, la distance d'édition entre «chat» et «destin» est de deux.