Автоматизоване реферування: відмінності між версіями

[неперевірена версія][неперевірена версія]
Вилучено вміст Додано вміст
м суміш розкладок за допомогою AWB
м суміш розкладок за допомогою AWB
Рядок 41:
Розробка і перспективи використання методів автоматизованого реферування тісно пов'язані з проблемами оцінювання якості машинних квазірефератів. Якість їх визначають на основі виявлення текстових збігів у рефератах, які підготувала людина, і автоматичних, а також шляхом порівняння результатів пошуку за текстами інтелектуальних і квазірефератів.
 
Одним з класичних завдань [[Математична лінгвістика|комп'ютерної лінгвістики]] є побудова систем автоматичного реферування наукових, технічних, політичних, ділових текстів. Актуальність цього завдання значно зростає у зв'язку з появою на інформаційному ринку повнотекстових баз даних. Ці бази містять у вигляді документів не реферати, а тексти наукових статей. Якщо ж ідеться про іншомовні бази, то треба, очевидно, прагнути до побудови систем, які інтегрують 3 основні функції: пошук, переклад i реферування. Розробка системи автоматичного реферування є можливою на основі експериментально-семантичного дослідження міжфразової структури тексту, з наступною реалізацією ІС, що володіють спроможністю гіперсинтаксичного «розуміння» текстів [3, с. 45-50].
 
== Система квазіреферування ==
Рядок 49:
=== Принципи реалізації системи квазіреферування ===
 
Розглянемо принципи, що розроблені під керівництвом автора системи квазiреферуванняквазіреферування.
Отже, на першому етапiетапі реалiзацiїреалізації принцип дiїдії системи полягає у формуваннiформуванні квазiрефератаквазіреферата з автосемантичних речень тексту. Програмне забезпечення системи для [[ЄС ЕОМ]] включає головну програму й сiмсім процедур. Головна програма виконує такiтакі функцiїфункції: — читання тексту, що реферується; — розмiщеннярозміщення словникiвсловників в оперативнiйоперативній пам'ятiяті; — аналiзаналіз тексту по реченнях: видiленнявиділення слiвслів, пошук в Ск i перевiркуперевірку збiгузбігу лексичної одиницiодиниці, що аналiзуєтьсяаналізується, з одним із конекторiвконекторів; — у разiразі збiгузбігу — звернення до процедур, обчислення значення логiчноїлогічної функцiїфункції по результатах роботи процедур, прийняття рiшеннярішення про iстинiстьістиність конектора i визначення типу речення вiдповiдновідповідно до типу конектора; — прийняття рiшеннярішення про включення чи невключення речення до квазiрефератуквазіреферату; — друк квазiрефератуквазіреферату на принтерiпринтері. По мiрiмірі роботи головної програми формується таблиця речень, що є основним результатом цiєїцієї програми. Рядок таблицiтаблиці вiдповiдаєвідповідає одному реченню. На час звернення до процедури всiвсі рядки, котрiкотрі мають вiдношеннявідношення до попереднiхпопередніх за порядком слiдуванняслідування реченням, цiлкомцілком заповненiзаповнені. Рядок, котрий вiдноситьсявідноситься до речення, пiдпід час аналiзуаналізу якого сталося звертання до процедури, в момент звернення заповнений частково. Рядок таблицiтаблиці має таку структуру: — номер речення; — кiлькiстькількість символiвсимволів у реченнiреченні; — тип речення; — автосемантичне чи синсемантичне; — номер речення, з яким дане знаходиться в синтаксичному зв'язку; — номер конектора в Ск. Кожна процедура має доступ до адрес початку тексту, початку речення, аналiзованогоаналізованого слова, початку таблицiтаблиці речень, початку Ск, початку Св, а також до порядкових номерiвномерів речення, аналiзованогоаналізованого слова в реченнiреченні, першого символу слова вiдносновідносно початку речення, до змiщеннязміщення початку запису Ск, до значень параметрiвпараметрів, зазначених в описах Ск. Як бачимо,[[Програмне забезпечення| програмне забезпечення]] системи не залежить від мови тексту, що обробляється. Для реферування текстiвтекстів на iншiйіншій мовiмові достатньо органiзуватиорганізувати словник конекторiвконекторів i допомiжнийдопоміжний словник на цiйцій мовiмові. Система реалiзованареалізована на мовiмові Асемблер пiдпід управлiннямуправлінням ДОС i ОС [[ЄС ЕОМ]]. [[Документ]] надходить до системи у виглядiвигляді текстового файлу, в якому допускається видiленнявиділення за допомогою спецiальнихспеціальних службових символiвсимволів заголовкiвзаголовків документiвдокументів i окремих його пiдроздiлiвпідрозділів, а також елементiвелементів бiблiографiчногобібліографічного опису. Вся видiленавиділена таким чином iнформацiяінформація включається системою у квазiрефератквазіреферат [5]. Результатом роботи системи є друкована копiякопія квазiрефератуквазіреферату, сформованого з автосемантичних речень тексту з вказiвкоювказівкою їх порядкових номерiвномерів у вхiдномувхідному текстiтексті. Якщо при цьому коефiцiенткоефіцієнт редукцiїредукції вхiдноговхідного тексту виявляється менше 4, то у квазiрефератквазіреферат не вводяться iзольованiізольовані автосемантичнiавтосемантичні речення: з послiдовностiпослідовності автосемантичних речень у квазiрефератквазіреферат вводяться тiлькитільки першiперші.
Передбачений також режим, у якому до квазiрефератуквазіреферату потрапляють не тiлькитільки автосемантичнiавтосемантичні речення, але й вказiвкавказівка на тип вилучених синсемантичних. Це дозволить у майбутньому органiзуватиорганізувати дiалогдіалог користувача з ЕОМ, запрошуючи у системи субтексти, котрiкотрі мають iнтересінтерес для абонента.
 
== Джерела ==