Юнікод: відмінності між версіями

[неперевірена версія][неперевірена версія]
Вилучено вміст Додано вміст
Немає опису редагування
правопис
Рядок 64:
{{Main|Маркер порядку байтів}}
 
Для визначення формату представлення Юнікода в текстовому файлі використовується прийом, поза якомуяким на початку тексту записується символ U+FEFF (нерозривний пропуск з нульовою шириною), також іменований [[Маркер порядку байт|міткою порядку байтів]] ({{lang-en|Byte Order Mark}}, BOM). Цей спосіб дозволяє розрізняти UTF-16LE і UTF-16BE, оскільки символу U+FFFE не існує. Також він іноді застосовується для позначення формату UTF-8, хоча до цього формату і непридатне поняття порядку байтів. Файли, які дотримуються цього правила, починаються з таких байтів:
 
* UTF-8: EF BB BF
Рядок 76:
 
== Кодування та типи текстових даних мови С/С++ ==
У мові С/С++ історично склалася така ситуація. Для роботи зі «звичайними» текстовими даними існує тип char. Для роботи з, так званим, «широким» текстом існує тип wchar_t. Особливості використання цих типів даних залежитьзалежать від системи. А власне особливостями є кодування тексту в типах даних, та розмір одного символу. Для порівняння візьмемо дві системи:
Linux