[перевірена версія][перевірена версія]
Вилучено вміст Додано вміст
м Відкинуто редагування 194.44.221.10 (обговорення) до зробленого Bunyk
Немає опису редагування
Рядок 1:
[[Файл:Unicode logo.svg|міні|140 пкс|Логотип Unicode]]
'''Юніко́д''', ({{lang-en|Unicode}}), УНІфіковане КОДування — [[стандартизація|промисловий стандарт]], розроблений, щоб забезпечити цифрове представлення символів усіх писемностей світу та спеціальних символів. Удосконалений сумісно з стандартом Універсальний Набір Символів (''Universal Character Set — UCS'') і опублікований у формі книги ''Стандарт Юнікод'', Юнікод складається з асортименту символів, методології кодування та комплекту (набору) стандартів [[кодування символів]], комплекту кодових таблиць для посилань на зображення символів, списку властивостей символів таких, наприклад, як верхній і нижній [[регістр (розкладка)]], комплект довідкових даних комп'ютерних файлів, правил нормалізації, декомпозиції, зіставлення і зображення ([[рендеринг]]у).
 
== Огляд ==
 
Стандарт запропонувала в [[1991]] році організація ''Консорціум Юнікоду'' ({{lang-en|Unicode Consortium}}), яка об'єднує найбільші [[Інформаційні технології|ІТ]]-[[компанія|компанії]] (корпорації). ''Консорціум Юнікоду'' — неприбуткова (некомерційна) організація, яка координує розвиток Юнікоду, має амбітну мету замінити в кінцевому підсумку існуючі системи кодування символів Юнікодом і його системою стандартів Формат Перетворень Юнікоду (''UTF, Unicode Transformation Format''), тому що багато існуючих систем кодування є обмеженими в розмірі й можливостях і несумісними з багатомовними середовищами. Успіхи Юнікоду в уніфікації наборів символів призвели до його розповсюдження і домінуючого використання в [[інтернаціоналізація|інтернаціоналізації]] і [[Локалізація програмного продукту|локалізації]] [[програмне забезпечення|програмного забезпечення]] комп'ютерів. Стандарт був використаний у багатьох новітніх технологіях, наприклад, у ''[[XML]]'', [[мова програмування|мові програмування]] ''[[JavaScript]]'' і сучасних [[операційна система|операційних системах]].
Рядок 8 ⟶ 10:
Юнікод має декілька реалізацій, але найпоширенішими є дві: ''UTF (Unicode Transformation Format)'' — Формат Перетворення Юнікоду та ''UCS (Universal Character Set)''  — Універсальна Таблиця Символів. Число після UTF визначає кількість бітів, що виділені під один юніт, а число після UCS визначає кількість байтів. Універсальний набір символів задає однозначну відповідність символів [[код]]ам — елементам кодового простору, тобто невід'ємним цілим числам. ''[[UTF-8]]'' став найпоширенішим для інтернаціональних кодувань.
 
''[[UTF-8]]'' є системою кодування зі змінною довжиною кодування символів. Це означає, що для кодування символів він використовує від 1 до 4 байт на символ. Так, перший байт ''UTF-8'' можна використовувати для кодування ''[[ASCII]]'', що дає повну сумісність з кодами ''ASCII''. Перекодування кодів ''ASCII'' у кодах ''UTF-8'' для латинських символів не збільшить розмір даних, бо для цього використовується тільки один байт на символ. Для символів інших мов, де, наприклад, для кодування треба використовувати два байти на символ, це кодування збільшує розмір даних на, приблизно, 50 % або більше.
 
''[[UTF-8]]'' дозволяє працювати в стандартизованому міжнародно прийнятому багатомовному середовищі, з порівняно незначним збільшенням обсягу даних. ''UTF-8'' являє собою ідеальний спосіб передачі символів через Інтернет, електронну пошту, чат тощо.