IRC: відмінності між версіями

[перевірена версія][перевірена версія]
Вилучено вміст Додано вміст
→‎Опис IRC: в української Вікіпедії є irc-канал
→‎Відомі IRC-мережі: Матеріял без джерел про російську мову в IRC — офтопік і ОД
Рядок 95:
 
У названих мережах найбільш вживаною мовою спілкування є [[англійська мова|англійська]]. Існують і мережі, основна мова яких відрізняється від англійської, зокрема '''[[російська мова|російськомовні]] мережі:'''
<! - Дані netsplit.de за останні 2 місяці, оновлено 19.05.2009 -->
* [[RusNet]]
* [[WeNet]]
* [[DALNet.RU]]
 
=== Історія питання ===
Перші російськомовні канали виникли ще в 1990-х роках у міжнародних мережах, таких як DALnet і IRCNet. Спочатку, під впливом UNIX-культури, було прийнято кодувати літери російського алфавіту в [[KOI-8]].
Приблизно з 1995 року почався приплив користувачів Windows, які найчастіше взагалі не мали поняття, що таке [[кодова сторінка]], і не робили різниці між кирилицею та [[Windows-1251]].
Дане протиріччя викликало багато конфліктів, включаючи [[холівари]].
В ті часи Стихійно виникла домовленість: питання про кодуваннях віддали у відання конкретних каналів.
Це було дуже незручно для користувачів, проте на той момент іншого виходу не було.
Частково, саме ця проблема стимулювала приблизно з [[2000]]-го посилене формування окремих російськомовних мереж, де питання кодування могли б вирішуватися централізовано.
 
=== [[Нікнейм|Ніки]] ===
Історично використання букв кирилиці в ніках було неможливо.
Однак деякі сучасні [[IRCd|сервери]] дозволяють це робити.
Чи вважати літери кирилиці, візуально схожі на букви латиниці, тієї ж самої буквою?
Якщо вважати, то які саме і як саме?
Різні мережі мають різну політику щодо всього цього.
 
=== [[UTF-8]] — за і проти ===
Прихильники [[інтернаціоналізація|інтернаціоналізації]] зазвичай вважають UTF-8 перспективним кодуванням для всіх мов, включаючи російську.
Слід однак відзначити, що одна буква кирилиці в UTF-8 займає [[октет (інформатика)|два байти]], що створює деяке додаткове навантаження на мережі й обмежує максимальну довжину одного повідомлення.
За стандартом, повідомлення IRC не може мати довжину більше 510 байтів, з яких власне на текст припадає ніяк не більше 499 (за нереалістично завищеною оцінкою).
Отже, відправити в одному повідомленні більше 249 російських букв виявляється неможливо.
Обмеження розміру повідомлень викликає ще одну неприємність: при спробі перевищити встановлену межу сервер обрізає повідомлення.
Якщо зріз пройде посередині російської букви (тобто буде передано перший її байт, але відкинутий другий), то вийшла, послідовність байтів перестане, з точки зору UTF-8, бути правильною рядком.
Ряд клієнтів (наприклад, [[Xchat]] або [[mIRC]]) відобразять таке повідомлення як [[кодова сторінка|8-бітне]] (наприклад, в [[Latin-1]] або Windows-1251), що зробить його повністю нечитабельним і займе, до того ж, багато місця на екрані.
 
Єдиної безперечною перевагою використання UTF-8 для кодування російської мови є можливість вільно цитувати тексти на інших мовах, а також використовувати екзотичні символи на зразок «→» і «☺».
До того ж, будучи клієнтом IRC-мережі, в якій UTF-8 прийнятий повсюдно, можна буде спілкуватися відразу на багатьох мовах, не піклуючись про технічне поданні літер.
Поки, проте, невідомі багатомовні мережі, явно обмовляють необхідність використання тільки UTF-8, що використовують UTF-8 як внутрішнє кодування, або яким-небудь іншим чином упорядковують кодування символів клієнтами.
 
== Див. також ==