UTF-16: відмінності між версіями

[неперевірена версія][неперевірена версія]
Вилучено вміст Додано вміст
→‎Посилання: Стаття, які слід категоризувати за допомогою AWB
Немає опису редагування
Рядок 1:
'''UTF-16''' ({{lang-en|Unicode Transformation Format}}) в [[Інформатика|інформатиці]] — один із способів [[кодування символів]] із [[Unicode]] у вигляді послідовності 16-[[біт]]ових слів. Символи з кодами менше 0x10000 (216) представляються як є, а символи з кодами 0x10000-0x10FFFF — у вигляді послідовності двох 16-бітових слів, перше з яких лежить в діапазоні 0xD800-0xDBFF, а друге — 0xDC00-0xDFFF. Зрозуміло, що є 210 * 210 = 220 таких комбінацій.
 
<small>||||||||||||||||||||||||||||||||<font color=#0000CC>|</font>|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||<font color=#FF7000>||||</font><font color=#0070FF>||||</font>||||||||||||||||||||||||||||||||</small>
 
Слід зазначити, що за стандартом ніякі символи не можуть мати коди власне з діапазону 0xD800-0xDFFF (їх 2048, вони відзначені рудим і блакитним кольорами на діаграмі), так що розшифровка кодування завжди однозначна. Втім, в переважній більшості випадків текст в UTF-16 є просто послідовністю символів з UCS-2 (BMP), тому що символи Unicode після коду 0x10000 використовуються вкрай рідко.