Outil pour encoder et decoder des caracteres en echappement Unicode, generer des sequences \uXXXX ou \u{X} (escape) et convertir du texte Unicode en ligne.
Echappement Unicode - dCode
Catégorie(s) : Codage de Caractères
dCode est gratuit et ses outils sont une aide précieuse dans les jeux, les maths, les énigmes, les géocaches, et les problèmes à résoudre au quotidien !
Une suggestion ? un problème ? une idée ? Écrire à dCode !
L'échappement Unicode (escape) est une méthode pour représenter un caractère Unicode en utilisant sa valeur numérique (point de code) plutôt que le caractère lui-même.
Cette notation commence généralement par un antislash \ suivi d'un préfixe et de chiffres hexadécimaux.
Cette abstraction permet de manipuler du texte dans des environnements où l'affichage direct d'un caractère spécial n'est pas garanti ou souhaité.
Pour encoder un caractère en échappement Unicode :
— Identifier le point de code Unicode du caractère
— Convertir cette valeur en hexadécimal
— Appliquer le format d'échappement approprié (voir ci-après)
Exemple : Le caractère e accent aigu é, a pour point de code 233, soit 0xE9 en hexadécimal, et se note avec la séquence d'échappement \u00E9 ou é
Les formats d'échappement Unicode correspondent aux différentes manières de représenter un point de code sous forme textuelle. Les syntaxes les plus répandues incluent plusieurs conventions utilisées selon les langages, les moteurs d'expressions régulières ou les systèmes de sérialisation.
— Format \uXXXX : format standard le plus ancien, notation hexadécimale fixe sur 4 digits. Ce format est fréquent dans Java, JSON ou certains parsers mais est limité au Basic Multilingual Plane (BMP), soit les caractères entre U+0000 et U+FFFF. Pour les caractères hors BMP, générer deux séquences consécutives correspondant à une paire substitutive.
— Format \u{X} : format standard le plus récent, notation variable encapsulée entre accolades. Représenter n'importe quel point de code sans contrainte de longueur. Syntaxe utilisée dans JavaScript moderne, Rust, PHP et la plupart des langages modernes sauf Python.
— Format \UXXXXXXXX : format utilisé dans le langage Python pour représenter directement des points de code complets sur 8 chiffres hexadécimaux, sans passer par des paires substitutives.
— Format \x{X} : format remplaçant u par x présent dans certains moteurs d'expressions régulières (comme PCRE).
— Format \X : format utilisé dans le langage CSS, ayant la notation la plus simplifiée en utilisant un préfixe antislash suivi d'hexadécimal directement. Approche parfois ambiguë car historiquement liée à des échappements octaux ou hexadécimaux selon les langages.
Décoder une séquence d'échappement Unicode implique :
— Reconnaître le motif : \uXXXX, \u{X} ou autre
— Extraire la partie hexadécimale
— Convertir l'hexadécimal en décimal pour obtenir le point de code
— Interpréter ce point de code comme caractère Unicode
Exemple : \u0041, extraire 0041, convertir en décimal 65, soit le caractère Unicode A
La plupart des langages de programmation fournissent des fonctions natives pour ce traitement.
Identifier une séquence d'échappement Unicode par ces patterns caractéristiques :
— \uXXXX : antislash + u + 4 chiffres hexadécimaux
— \u{X} ou \u{XXXX} : notation flexible avec accolades
— \UXXXXXXXX : antislash + U + 8 chiffres hexadécimaux
Les variantes courantes incluent :
\uXXXX : notation standard sur 4 digits
\u{X} : notation compacte moderne
\UXXXXXXXX : notation sur 8 digits utilisée dans certains langages comme Python
\x{X} : notation alternative selon certains moteurs d'expressions régulières
HTML : XXXX; (notation entièrement différente)
Encodage d'URL : %XX
Les paires substitutives générées par UTF-16 pour des points de code supérieurs à U+FFFF
dCode se réserve la propriété du code source pour "Echappement Unicode". Tout algorithme pour "Echappement Unicode", applet ou snippet ou script (convertisseur, solveur, chiffrement / déchiffrement, encodage / décodage, encryptage / décryptage, traducteur) ou toutes fonctions liées à "Echappement Unicode" (calculer, convertir, résoudre, décrypter / encrypter, déchiffrer / chiffrer, décoder / encoder, traduire) codés en langage informatique (Python, Java, C#, PHP, Javascript, Matlab, etc.) ou toute base de données, ou accès API à "Echappement Unicode" ou tout autre élément ne sont pas publics (sauf licence open source explicite). Idem avec le téléchargement pour un usage hors ligne sur PC, mobile, tablette, appli iPhone ou Android.
Rappel : dCode est une ressource éducative et pédagogique, accessible en ligne gratuitement et pour tous.
Le contenu de la page "Echappement Unicode" ainsi que ses résultats peuvent être copiés et réutilisés librement, y compris à des fins commerciales, à condition de mentionner dCode.fr comme source (Licence de libre diffusion Creative Commons CC-BY).
L'export des résultats est gratuit et se fait simplement en cliquant sur les icônes d'export ⤓ (format .csv ou .txt) ou ⧉ copier-coller.
Pour citer dCode.fr sur un autre site Internet, utiliser le lien :
Dans un article scientifique ou un livre, la citation bibliographique recommandée est : Echappement Unicode sur dCode.fr [site web en ligne], consulté le 18/11/2025,