> inspizieren | dekodieren | analysieren <
// Unicode-Codepunkte, Kodierungen und Zeichendetails untersuchen
Zeichenanalyse
Analysieren Sie jeden Text Zeichen für Zeichen. Zeigen Sie Codepunkte, Dezimalwerte und Unicode-Block-Informationen an.
UTF-8/UTF-16-Ansicht
Sehen Sie die exakte Byte-Darstellung in UTF-8- und UTF-16-Kodierung für jedes Zeichen.
Block-Erkennung
Erkennen und zeigen Sie automatisch den Unicode-Block für jedes Zeichen an.
// ÜBER UNICODE
Wie Unicode funktioniert:
Unicode ist ein universeller Zeichenkodierungsstandard, der jedem Zeichen einen eindeutigen Codepunkt (U+0000 bis U+10FFFF) zuweist. Die Basic Multilingual Plane (BMP, U+0000 bis U+FFFF) deckt die meisten gängigen Zeichen ab. UTF-8 verwendet 1-4 Bytes pro Zeichen, während UTF-16 2 oder 4 Bytes verwendet.
Beispiel:
"A" → U+0041, Dezimal 65, UTF-8: 41, UTF-16: 0041
Häufige Anwendungsfälle:
- >Kodierungsprobleme in mehrsprachigem Text debuggen
- >Unsichtbare oder verwechselbare Zeichen untersuchen
- >Korrekte UTF-8/UTF-16-Bytesequenzen überprüfen
- >Unicode-Codepunkte und -Blöcke nachschlagen
- >Emoji- und Sonderzeichen-Kodierung analysieren
>> häufig gestellte Fragen
Q: Was ist Unicode?
A: Unicode ist ein universeller Zeichenkodierungsstandard, der jedem Zeichen aus jedem Schriftsystem eine eindeutige Nummer (Codepunkt) zuweist.
Q: Was ist der Unterschied zwischen UTF-8 und UTF-16?
A: UTF-8 verwendet 1-4 Bytes pro Zeichen und ist abwärtskompatibel mit ASCII. UTF-16 verwendet 2 oder 4 Bytes und wird intern von JavaScript und Windows verwendet.
Q: Was ist die Basic Multilingual Plane (BMP)?
A: Die BMP ist die erste Unicode-Ebene (U+0000 bis U+FFFF), die die am häufigsten verwendeten Zeichen enthält.
Q: Wie viele Unicode-Zeichen gibt es?
A: Unicode kann theoretisch 1.114.112 Codepunkte darstellen. Über 149.000 Zeichen sind derzeit zugewiesen.
Q: Was ist ein Codepunkt?
A: Ein Codepunkt ist der numerische Wert, der einem Zeichen in Unicode zugewiesen wird (z.B. U+0041 für 'A').