Outil pour générer les clés Soundex de mots/noms. Identifier les équivalences phonétiques et les ressemblances de prononciation afin d'optimiser la recherche et l’indexation des données.
Soundex - dCode
Catégorie(s) : Traitement de Données
dCode est gratuit et ses outils sont une aide précieuse dans les jeux, les maths, les énigmes, les géocaches, et les problèmes à résoudre au quotidien !
Une suggestion ? un problème ? une idée ? Écrire à dCode !
Soundex est un algorithme phonétique conçu pour encoder des mots, en particulier des noms propres, afin de regrouper ceux qui se prononcent de manière similaire malgré des orthographes différentes.
L'objectif est d'améliorer la recherche approximative, l'indexation phonétique et la détection de variantes orthographiques dans les bases de données.
Soundex génère une clé composée d'une lettre suivie de trois chiffres en suivant ces règles :
— Conserver la première lettre du mot
— Transformer les consonnes restantes en codes numériques selon des groupes phonétiques : BFPV=1, CGJKQSXZ=2, DT=3, L=4, MN=5, R=6
— Supprimer les voyelles (sauf la première lettre), les H et W
— Fusionner les codes identiques consécutifs
— Tronquer ou compléter avec des zéros pour obtenir une longueur finale de quatre caractères
Exemple : DCODE se code D230
Il n'existe pas d'algorithme Soundex inverse. Pour retrouver un mot à partir d'une clé, comparer cette clé avec celles des mots d'un dictionnaire ou d'une base de données.
Les mots partageant la même clé sont considérés comme phonétiquement similaires.
Soundex présente de nombreuses limitations :
— Sensibilité à la première lettre
— Adaptation mauvaise pour les langues non anglo-saxonnes
— Regroupements trop larges, générant des faux positifs
— Manque de précision pour les noms courts ou atypiques
Identifier une clé Soundex via sa structure typique : une lettre majuscule suivie de trois chiffres entre 0 et 6
La première lettre correspond littéralement à celle du mot d'origine, tandis que les chiffres encodent les sonorités consonantiques.
Soundex a été formalisé au début du XXe siècle, notamment dans le cadre des travaux de recensement aux États-Unis, vers les années 1910–1920, pour faciliter la recherche de patronymes malgré leurs orthographes souvent variables.
dCode se réserve la propriété du code source pour "Soundex". Tout algorithme pour "Soundex", applet ou snippet ou script (convertisseur, solveur, chiffrement / déchiffrement, encodage / décodage, encryptage / décryptage, traducteur) ou toutes fonctions liées à "Soundex" (calculer, convertir, résoudre, décrypter / encrypter, déchiffrer / chiffrer, décoder / encoder, traduire) codés en langage informatique (Python, Java, C#, PHP, Javascript, Matlab, etc.) ou toute base de données, ou accès API à "Soundex" ou tout autre élément ne sont pas publics (sauf licence open source explicite). Idem avec le téléchargement pour un usage hors ligne sur PC, mobile, tablette, appli iPhone ou Android.
Rappel : dCode est une ressource éducative et pédagogique, accessible en ligne gratuitement et pour tous.
Le contenu de la page "Soundex" ainsi que ses résultats peuvent être copiés et réutilisés librement, y compris à des fins commerciales, à condition de mentionner dCode.fr comme source (Licence de libre diffusion Creative Commons CC-BY).
L'export des résultats est gratuit et se fait simplement en cliquant sur les icônes d'export ⤓ (format .csv ou .txt) ou ⧉ copier-coller.
Pour citer dCode.fr sur un autre site Internet, utiliser le lien :
Dans un article scientifique ou un livre, la citation bibliographique recommandée est : Soundex sur dCode.fr [site web en ligne], consulté le 09/12/2025,