inspecter | décoder | analyser

> inspecter | décoder | analyser <

// Inspectez les points de code Unicode, les encodages et les détails des caractères

[INSPECT]

Analyse de caractères

Analysez tout texte caractère par caractère. Affichez les points de code, valeurs décimales et informations de bloc Unicode.

[ENCODE]

Vue UTF-8/UTF-16

Voyez la représentation exacte en octets UTF-8 et UTF-16 pour chaque caractère.

[FREE]

Détection de bloc

Détectez et affichez automatiquement le bloc Unicode pour chaque caractère, du Latin de base aux CJK et emoji.

// À PROPOS D'UNICODE

Comment fonctionne Unicode:

Unicode est une norme universelle d'encodage de caractères qui attribue un point de code unique (U+0000 à U+10FFFF) à chaque caractère. Le Plan Multilingue de Base (BMP, U+0000 à U+FFFF) couvre la plupart des caractères courants. Les plans supplémentaires (U+10000+) incluent les emoji, les écritures historiques et les idéogrammes CJK rares.

Exemple:

"A" → U+0041, Décimal 65, UTF-8: 41, UTF-16: 0041

Cas d'utilisation courants:

  • >Déboguer les problèmes d'encodage dans le texte multilingue
  • >Inspecter les caractères invisibles ou confondants
  • >Vérifier les séquences d'octets UTF-8/UTF-16 correctes
  • >Rechercher les points de code et blocs Unicode
  • >Analyser l'encodage des emoji et symboles spéciaux

>> questions fréquemment posées

Q: Qu'est-ce qu'Unicode ?

A: Unicode est une norme universelle d'encodage de caractères maintenue par le Consortium Unicode. Elle attribue un numéro unique (point de code) à chaque caractère de chaque système d'écriture, y compris le latin, le chinois, l'arabe, les emoji et les symboles.

Q: Quelle est la différence entre UTF-8 et UTF-16 ?

A: UTF-8 utilise 1 à 4 octets par caractère et est rétrocompatible avec ASCII. UTF-16 utilise 2 ou 4 octets et est utilisé en interne par JavaScript et Windows.

Q: Qu'est-ce que le Plan Multilingue de Base (BMP) ?

A: Le BMP est le premier plan Unicode (U+0000 à U+FFFF) contenant les caractères les plus couramment utilisés.

Q: Combien de caractères Unicode existe-t-il ?

A: Unicode peut théoriquement représenter 1 114 112 points de code. Plus de 149 000 caractères sont actuellement attribués.

Q: Qu'est-ce qu'un point de code ?

A: Un point de code est la valeur numérique attribuée à un caractère dans Unicode (par ex. U+0041 pour 'A').

// AUTRES LANGUES