Текстовий файл: відмінності між версіями

[неперевірена версія][перевірена версія]
Вилучено вміст Додано вміст
зображення, оформлення, стильові правлення, правопис, категоризація, шаблон, категоризація, правопис, правопис, стильові правлення, оформ...
м Відкинути редагування 46.211.22.202 до зробленого Vlasenko D
Рядок 1:
 
{{DisambigG[[Файл:CsvDelimited001.svg|thumb|Піктограммний опис текстового файлу з [[CSV]]-даними]]
 
'''Те́кстовий файл''' — форма подання послідовності [[символ]]ів у [[комп'ютер]]і, де кожен символ із задіяного [[набір символів|набору символів]] [[код]]ується одним [[байт]]ом чи послідовністю двох, трьох і т. д. байтів.
Рядок 6 ⟶ 7:
== Опис ==
 
Текстовий файл&nbsp;— послідовність [[символ|символів]] (переважно [[Друковані символи|друкованих знаків]], що належать тому чи іншому [[кодування символів|набору символів]]). Ці символи зазвичай згруповані в рядки ({{lang-en|lines, rows}}). У сучасних системах рядки розділяються [[newline|роздільниками рядків]], у минулому ж рядки зберігались у вигляді записів постійної або змінної довжини (див.: [[Перфокарта]]). Іноді кінець текстового файлу (особливо тоді, коли в файловій системі не зберігається інформація про розмір файлу) також позначається спеціальними знаками (одним або більше), відомими як маркери [[EOF|кінця файлу]].<br/br>
Текстовий файл може містити як [[Формат # Форматування|форматований]], так і неформатований текст.
Рядок 12 ⟶ 13:
 
=== Переваги та недоліки ===
 
==== Переваги: ====
* Універсальність&nbsp;— текстовий файл може бути прочитаний (так чи інакше) на будь-якій системі або [[Операційна система|ОС]], особливо, якщо йдеться про однобайтові кодування на кшталт [[ASCII]], які не схильні до проблеми, характерної для інших форматів файлів&nbsp;— для них не важлива різниця в [[порядок байтів|порядку байтів]] або довжині [[машинне слово|машинного слова]] на різних [[комп'ютерна платформа|платформах]].
* Стійкість&nbsp;— кожне слово та символ у такому файлі самодостатні і, якщо трапиться пошкодження байтів у такому файлі, то зазвичай можна відновити дані за [[контекстом]] або продовжити обробку решти вмісту, в той час як у [[Стиснення даних|стиснених]] чи двійкових файлів пошкодження декількох байтів може зробити файл абсолютно невідновним. Багато [[система керування версіями|систем управління версіями]] розраховані на текстові файли і з двійковими файлами можуть працювати лише як з єдиним цілим.
* Формат текстового файлу вкрай простий і його можна змінювати [[текстовий редактор|текстовим редактором]]&nbsp;— програмою, яка входить в комплект практично будь-якої [[Операційна система|ОС]].
 
==== Недоліки: ====
* У великих нестиснутих текстових файлів низька [[інформаційна ентропія]]&nbsp;— ці файли займають більше місця, ніж мінімально необхідно. Хоча ця ж {{нп5|надмірність інформації|||Redundancy (information theory)}} визначає підвищену стійкість до збоїв у каналах передачі даних і при отриманні даних з [[Носій інформації|носіїв]], наприклад, з [[Магнітна стрічка|магнітної стрічки]].
* Деякі операції з текстовими файлами неефективні. Наприклад, якщо в файлі зустрінеться число, обчислювальна система до початку операцій з ним повинна буде перетворити його в свій внутрішній формат, застосувавши порівняно складну процедуру конвертації числа; щоб перейти на 1000-ий рядок, потрібно порахувати попередні 999 рядків; складно замінити один рядок іншим, тощо. Тому при роботі з [[база даних|великими обсягами даних]] текстові файли застосовують лише як проміжний формат, що забезпечує {{нп5|інтероперабельність|||Interoperability}}.
 
=== Формати, засновані на текстових файлах ===
В силу своєї простоти текстові файли нерідко використовуються для зберігання службової інформації (наприклад, {{нп5|Файл реєстрації|логів|ru|Файл_регистрации}}): оскільки операція додавання в кінець текстового файлу нових даних не вимагає значних обчислювальних ресурсів (незалежно від уже наявного обсягу файлу і виду текстових даних, що додаються), ведення текстових лог-файлів зазвичай відбувається ефективно та непомітно для користувача і для інших додатків (аж до вичерпання дискового простору). Текстовий формат служить основою для багатьох спеціалізованих [[формат файлу|форматів]] (наприклад, [[.ini]], [[SGML]], [[HTML]], [[XML]], [[TeX]], [[Сирцевий код|вихідних текстів]] мов програмування).
 
В текстовому файлі текст може зберігатися як в неформатованому, так і в форматованому або розміченому вигляді (наприклад, [[Rich Text Format]], [[HTML]]), де кожен символ чи група символів (рядки, абзаци, таблиці тощо) може бути відформатований (визначений шрифт, накреслення, розмір і т.&nbsp;д.).
Рядок 29:
 
=== Розширення імен файлів ===
В [[DOS]] і [[Microsoft Windows|Windows]] для файлів з неформатованим текстом зазвичай використовується [[розширення файлу|розширення]] <tt>.txt</tt>. Проте, текстовими можуть бути файли з будь-яким іншим розширенням або й без нього. Наприклад, [[сирцевий код|вихідні коди]] програм зазвичай зберігаються в файлах з розширеннями, відповідними [[мова програмування|мові програмування]], якою вони написані (<tt>.bas</tt>, <tt>.pas</tt>, <tt>.c</tt> тощо).
 
Форматований текст (текст із розміткою) зазвичай зберігається у файлах з розширенням, відповідним формату або [[Мова розмітки даних|мові розмітки]]&nbsp;— <tt>.rtf</tt>, <tt>.htm</tt>, <tt>.html</tt> тощо.
Рядок 37:
=== 8-бітний текст ===
{{main|Кодова сторінка}}
Історично для кодування текстових файлів застосовувалися 7-[[біт|бітний]]ний набір символів [[ASCII]], а також 8-бітні [[EBCDIC]] та різні розширення ASCII. У 8-бітних кодових сторінках у першій половині кодової таблиці загальноприйнято використовувати символи, відповідні ASCII.
 
Перевагою 8-бітного представлення тексту є програмна простота та незалежність від проблеми [[порядок байтів|порядку байтів]] або довжини [[машинне слово|машинного слова]] на різних платформах. Недолік&nbsp;— багато різних, часом {{нп5|несумісність|несумісних|ru|Несовместимость}} стандартів.
Рядок 48:
Різні операційні системи дотримуються свого уявлення про символи нового рядка та кінця файлу. В [[UNIX]] символ нового рядка&nbsp;— одиничний символ LF (код 0xA), в [[Mac OS]]&nbsp;— символ CR (код 0xD), а в [[DOS]] і [[Microsoft Windows|Windows]]&nbsp;— послідовність двох символів: CR і LF.
 
== Примітки ==
{{примітки}}
 
== Див.Дивись також ==
* [[Текст]]
* [[Текстовий редактор]]
Рядок 62:
 
[[Категорія:Формати файлів]]
[[Категорія: Формати текстових документів]]
[[Категорія: Формати електронних книг]]
}}