Skip to content

Режим Сжатия 05 — Character Encoding с v1.0.0

Этот режим сжатия использует внутренние Кодировки Символов JSSC, чтобы сжать входные данные путём внутреннего перекодирования UTF-16 символов в символы самой оптимальной Кодировки Символов JSSC и выдаёт результат в виде UTF-16 символов.

Каждая Кодировка Символов JSSC содержит 256 символов, благодаря этому каждый символ помещается в 8 битов. Таким образом, два таких символа — это один UTF-16 символ.

Пошаговый разбор

Входные данные: Hello, World! Привет, Мир! (Повторение «Привет, Мир» на английском и русском.)

  1. Выбор самой оптимальной Кодировки Символов JSSC — в данном случае это JSSCENRU.
  2. Внутреннее перекодирование входных данных (далее представлены шестнадцатеричные коды):
    • H48
    • e65
    • l6C
    • l6C - Обратите внимание, что JSSC input RLE может поставить 2 (32) здесь вместо l (6C).
    • o6F
    • ,2C
    • _20
    • W57
    • o6F
    • r72
    • l6C
    • d64
    • !21
    • _20
    • П8F
    • рB0
    • иA8
    • вA2
    • еA5
    • тB2
    • ,2C
    • _20
    • М8C
    • иA8
    • рB0
    • !21
  3. Выдать результат в виде UTF-16 символов:
    • 48 65
    • 6C 6C
    • 6F 2C
    • 20 57
    • 6F 72
    • 6C 64
    • 21 20
    • 8F B0
    • A8 A2
    • A5 B2
    • 2C 20
    • 8C A8
    • B0 21

Выходные данные: 䡥汬漬⁗潲汤℠辰ꢢꖲⰠ貨뀡