inspizieren | dekodieren | analysieren

> inspizieren | dekodieren | analysieren <

// Unicode-Codepunkte, Kodierungen und Zeichendetails untersuchen

[INSPECT]

Zeichenanalyse

Analysieren Sie jeden Text Zeichen für Zeichen. Zeigen Sie Codepunkte, Dezimalwerte und Unicode-Block-Informationen an.

[ENCODE]

UTF-8/UTF-16-Ansicht

Sehen Sie die exakte Byte-Darstellung in UTF-8- und UTF-16-Kodierung für jedes Zeichen.

[FREE]

Block-Erkennung

Erkennen und zeigen Sie automatisch den Unicode-Block für jedes Zeichen an.

// ÜBER UNICODE

Wie Unicode funktioniert:

Unicode ist ein universeller Zeichenkodierungsstandard, der jedem Zeichen einen eindeutigen Codepunkt (U+0000 bis U+10FFFF) zuweist. Die Basic Multilingual Plane (BMP, U+0000 bis U+FFFF) deckt die meisten gängigen Zeichen ab. UTF-8 verwendet 1-4 Bytes pro Zeichen, während UTF-16 2 oder 4 Bytes verwendet.

Beispiel:

"A" → U+0041, Dezimal 65, UTF-8: 41, UTF-16: 0041

Häufige Anwendungsfälle:

  • >Kodierungsprobleme in mehrsprachigem Text debuggen
  • >Unsichtbare oder verwechselbare Zeichen untersuchen
  • >Korrekte UTF-8/UTF-16-Bytesequenzen überprüfen
  • >Unicode-Codepunkte und -Blöcke nachschlagen
  • >Emoji- und Sonderzeichen-Kodierung analysieren

>> häufig gestellte Fragen

Q: Was ist Unicode?

A: Unicode ist ein universeller Zeichenkodierungsstandard, der jedem Zeichen aus jedem Schriftsystem eine eindeutige Nummer (Codepunkt) zuweist.

Q: Was ist der Unterschied zwischen UTF-8 und UTF-16?

A: UTF-8 verwendet 1-4 Bytes pro Zeichen und ist abwärtskompatibel mit ASCII. UTF-16 verwendet 2 oder 4 Bytes und wird intern von JavaScript und Windows verwendet.

Q: Was ist die Basic Multilingual Plane (BMP)?

A: Die BMP ist die erste Unicode-Ebene (U+0000 bis U+FFFF), die die am häufigsten verwendeten Zeichen enthält.

Q: Wie viele Unicode-Zeichen gibt es?

A: Unicode kann theoretisch 1.114.112 Codepunkte darstellen. Über 149.000 Zeichen sind derzeit zugewiesen.

Q: Was ist ein Codepunkt?

A: Ein Codepunkt ist der numerische Wert, der einem Zeichen in Unicode zugewiesen wird (z.B. U+0041 für 'A').

// ANDERE SPRACHEN