Режим Сжатия 05 — Character Encoding с v1.0.0
Этот режим сжатия использует внутренние Кодировки Символов JSSC, чтобы сжать входные данные путём внутреннего перекодирования UTF-16 символов в символы самой оптимальной Кодировки Символов JSSC и выдаёт результат в виде UTF-16 символов.
Каждая Кодировка Символов JSSC содержит 256 символов, благодаря этому каждый символ помещается в 8 битов. Таким образом, два таких символа — это один UTF-16 символ.
Пошаговый разбор
Входные данные: Hello, World! Привет, Мир! (Повторение «Привет, Мир» на английском и русском.)
- Выбор самой оптимальной Кодировки Символов JSSC — в данном случае это
JSSCENRU. - Внутреннее перекодирование входных данных (далее представлены шестнадцатеричные коды):
H→48e→65l→6Cl→6C- Обратите внимание, что JSSC input RLE может поставить2(32) здесь вместоl(6C).o→6F,→2C_→20W→57o→6Fr→72l→6Cd→64!→21_→20П→8Fр→B0и→A8в→A2е→A5т→B2,→2C_→20М→8Cи→A8р→B0!→21
- Выдать результат в виде UTF-16 символов:
4865→䡥6C6C→汬6F2C→漬2057→⁗6F72→潲6C64→汤2120→℠8FB0→辰A8A2→ꢢA5B2→ꖲ2C20→Ⱐ8CA8→貨B021→뀡
Выходные данные: 䡥汬漬⁗潲汤℠辰ꢢꖲⰠ貨뀡