кодировать | декодировать | сжимать

> \u0048 | javascript | unicode <

// Экранирование Unicode в JavaScript — перевод текста в формат \uXXXX или \u{}

[JAVASCRIPT]

Совместимость с JS

Стандартные Unicode‑escape‑последовательности для JavaScript и JSON.

[ES6]

Современный синтаксис

Поддержка формата ES6 \u{} для символов астральной плоскости.

[UNICODE]

Полная поддержка Unicode

Работает с эмодзи и символами за пределами Basic Multilingual Plane.

>> техническая информация

Как работают Unicode‑escapes в JavaScript:

JavaScript использует \uXXXX для символов из Basic Multilingual Plane (U+0000–U+FFFF). В ES6 появился синтаксис \u{}, который позволяет кодировать любой Unicode‑кодпоинт, включая эмодзи и символы астральной плоскости.

Примеры:

'A' → \u0041 '😀' → \u{1F600} (ES6) '\n' → \n

Зачем использовать Unicode‑escapes?:

  • >Кодирование JSON‑строк с особыми символами
  • >Безопасное хранение Unicode в исходном коде JavaScript
  • >Конфигурационные файлы с не‑ASCII‑символами
  • >Лучшая кросс‑платформенная совместимость
  • >Отладка проблем, связанных с нестандартными символами

>> часто задаваемые вопросы

Что такое Unicode‑escapes в JavaScript?

Unicode‑escapes — это последовательности вида \uXXXX, представляющие символы Unicode в строках JavaScript. С их помощью можно включать любые символы в код и JSON, даже если редактор не поддерживает их напрямую.

В чём разница между \uXXXX и \u{}?

\uXXXX ограничен четырьмя шестнадцатеричными цифрами и работает только с символами BMP. \u{} был добавлен в ES6, поддерживает 1–6 шестнадцатеричных цифр и охватывает все Unicode‑кодпоинты, включая эмодзи.

Когда стоит использовать Unicode‑escapes?

Используйте их при записи JSON с большим количеством специальных символов, при необходимости максимальной переносимости кода или если инструменты разработки некорректно обрабатывают отдельные символы.

Как работать с эмодзи?

Эмодзи обычно располагаются выше U+FFFF. Используйте синтаксис ES6 \u{...} (например, \u{1F600}) или, в старом JavaScript, пару суррогатных символов с двумя \uXXXX‑последовательностями.

Другие языки