> inspecter | décoder | analyser <
// Inspectez les points de code Unicode, les encodages et les détails des caractères
Analyse de caractères
Analysez tout texte caractère par caractère. Affichez les points de code, valeurs décimales et informations de bloc Unicode.
Vue UTF-8/UTF-16
Voyez la représentation exacte en octets UTF-8 et UTF-16 pour chaque caractère.
Détection de bloc
Détectez et affichez automatiquement le bloc Unicode pour chaque caractère, du Latin de base aux CJK et emoji.
// À PROPOS D'UNICODE
Comment fonctionne Unicode:
Unicode est une norme universelle d'encodage de caractères qui attribue un point de code unique (U+0000 à U+10FFFF) à chaque caractère. Le Plan Multilingue de Base (BMP, U+0000 à U+FFFF) couvre la plupart des caractères courants. Les plans supplémentaires (U+10000+) incluent les emoji, les écritures historiques et les idéogrammes CJK rares.
Exemple:
"A" → U+0041, Décimal 65, UTF-8: 41, UTF-16: 0041
Cas d'utilisation courants:
- >Déboguer les problèmes d'encodage dans le texte multilingue
- >Inspecter les caractères invisibles ou confondants
- >Vérifier les séquences d'octets UTF-8/UTF-16 correctes
- >Rechercher les points de code et blocs Unicode
- >Analyser l'encodage des emoji et symboles spéciaux
>> questions fréquemment posées
Q: Qu'est-ce qu'Unicode ?
A: Unicode est une norme universelle d'encodage de caractères maintenue par le Consortium Unicode. Elle attribue un numéro unique (point de code) à chaque caractère de chaque système d'écriture, y compris le latin, le chinois, l'arabe, les emoji et les symboles.
Q: Quelle est la différence entre UTF-8 et UTF-16 ?
A: UTF-8 utilise 1 à 4 octets par caractère et est rétrocompatible avec ASCII. UTF-16 utilise 2 ou 4 octets et est utilisé en interne par JavaScript et Windows.
Q: Qu'est-ce que le Plan Multilingue de Base (BMP) ?
A: Le BMP est le premier plan Unicode (U+0000 à U+FFFF) contenant les caractères les plus couramment utilisés.
Q: Combien de caractères Unicode existe-t-il ?
A: Unicode peut théoriquement représenter 1 114 112 points de code. Plus de 149 000 caractères sont actuellement attribués.
Q: Qu'est-ce qu'un point de code ?
A: Un point de code est la valeur numérique attribuée à un caractère dans Unicode (par ex. U+0041 pour 'A').