> inspizieren | dekodieren | analysieren <

// Unicode-Codepunkte, Kodierungen und Zeichendetails untersuchen

EINGABETEXT:

CODEPUNKT-SUCHE:

Zeichen	Codepunkt	Dezimal	UTF-8 Hex	UTF-16 Hex	Block

[INSPECT]

Zeichenanalyse

Analysieren Sie jeden Text Zeichen für Zeichen. Zeigen Sie Codepunkte, Dezimalwerte und Unicode-Block-Informationen an.

[ENCODE]

UTF-8/UTF-16-Ansicht

Sehen Sie die exakte Byte-Darstellung in UTF-8- und UTF-16-Kodierung für jedes Zeichen.

[FREE]

Block-Erkennung

Erkennen und zeigen Sie automatisch den Unicode-Block für jedes Zeichen an.

// ÜBER UNICODE

Wie Unicode funktioniert:

Unicode ist ein universeller Zeichenkodierungsstandard, der jedem Zeichen einen eindeutigen Codepunkt (U+0000 bis U+10FFFF) zuweist. Die Basic Multilingual Plane (BMP, U+0000 bis U+FFFF) deckt die meisten gängigen Zeichen ab. UTF-8 verwendet 1-4 Bytes pro Zeichen, während UTF-16 2 oder 4 Bytes verwendet.

Beispiel:

"A" → U+0041, Dezimal 65, UTF-8: 41, UTF-16: 0041

Häufige Anwendungsfälle:

>Kodierungsprobleme in mehrsprachigem Text debuggen
>Unsichtbare oder verwechselbare Zeichen untersuchen
>Korrekte UTF-8/UTF-16-Bytesequenzen überprüfen
>Unicode-Codepunkte und -Blöcke nachschlagen
>Emoji- und Sonderzeichen-Kodierung analysieren

>> häufig gestellte Fragen

Q: Was ist Unicode?

A: Unicode ist ein universeller Zeichenkodierungsstandard, der jedem Zeichen aus jedem Schriftsystem eine eindeutige Nummer (Codepunkt) zuweist.

Q: Was ist der Unterschied zwischen UTF-8 und UTF-16?

A: UTF-8 verwendet 1-4 Bytes pro Zeichen und ist abwärtskompatibel mit ASCII. UTF-16 verwendet 2 oder 4 Bytes und wird intern von JavaScript und Windows verwendet.

Q: Was ist die Basic Multilingual Plane (BMP)?

A: Die BMP ist die erste Unicode-Ebene (U+0000 bis U+FFFF), die die am häufigsten verwendeten Zeichen enthält.

Q: Wie viele Unicode-Zeichen gibt es?

A: Unicode kann theoretisch 1.114.112 Codepunkte darstellen. Über 149.000 Zeichen sind derzeit zugewiesen.

Q: Was ist ein Codepunkt?

A: Ein Codepunkt ist der numerische Wert, der einem Zeichen in Unicode zugewiesen wird (z.B. U+0041 für 'A').

// ANDERE SPRACHEN

🇺🇸 English 🇫🇷 Français 🇩🇪 Deutsch 🇪🇸 Español 🇵🇹 Português 🇮🇹 Italiano 🇳🇱 Nederlands 🇷🇺 Русский 🇯🇵 日本語 🇰🇷 한국어 🇨🇳 简体中文 🇹🇼 繁體中文 🇸🇦 العربية 🇮🇳 हिन्दी 🇵🇱 Polski 🇹🇷 Türkçe 🇸🇪 Svenska 🇩🇰 Dansk 🇳🇴 Norsk