Юнікод: відмінності між версіями
[перевірена версія] | [перевірена версія] |
Вилучено вміст Додано вміст
Рядок 62:
Для визначення формату представлення Юнікода в текстовому файлі використовується прийом, за яким на початку тексту записується символ ''U+FEFF'' (нерозривний пропуск з нульовою шириною), також іменований [[Маркер порядку байт|міткою порядку байтів]] ({{lang-en|Byte Order Mark}}, BOM). Цей спосіб дозволяє розрізняти ''UTF-16LE'' і ''UTF-16BE'', оскільки символу ''U+FFFE'' не існує. Також він іноді застосовується для позначення формату ''UTF-8'', хоча до цього формату і непридатне поняття порядку байтів. Файли, які дотримуються цього правила, починаються з таких байтів:
''* UTF-8: EF BB BF''
''* UTF-16BE: FE FF''
''* UTF-16LE: FF FE''
''* UTF-32BE: 00 00 FE FF''
''* UTF-32LE: FF FE 00 00''
== Кодовий простір ==
|