Deux mots sont dit proches si peu de choses les séparent orthographiquement ou phonétiquement parlant. La distance entre deux mots est d'autant plus grande que le nombre de différences entre les deux mots est grand.
La distance de Levenshtein mesure la similarité entre deux chaînes de caractères. Elle est égale au nombre minimal de caractères qu'il faut supprimer, insérer, ou remplacer pour passer d’une chaîne à l’autre.
La méthode d'Oliver prend en compte la position des lettres et accepte une certaine distance entre sa position originale et sa nouvelle.
Soundex est un algorithme phonétique d'indexation de noms par leur prononciation en anglais britannique. L'objectif basique est que les noms ayant la même prononciation soient codés avec la même chaîne de manière à pouvoir trouver une correspondance entre eux malgré des différences mineures d'écriture. Notez bien que Soundex prend en compte la prononciation à l'anglaise, et non pas à la française. Les résultats pourront donc être très différents de ce que l'on peut attendre.
Metaphone est un algorithme phonétique, algorithme pour indexer les mots selon leur sonorité lorsque prononcé en anglais. Metaphone a été développé pour répondre aux déficiences de l'algorithme Soundex.
© 2012 dcode.fr — Le site indispensable pour résoudre les énigmes, les jeux et les chasses au trésor. dCode