Семантична мережа: відмінності між версіями

[перевірена версія][перевірена версія]
Вилучено вміст Додано вміст
Немає опису редагування
Рядок 77:
 
Спроба створення семантичної мережі на основі [[Всесвітнє павутиння|всесвітньої павутини]] отримала назву '''семантичної павутини'''. Ця концепція має на увазі використання мови [[RDF]] (мови розмітки на основі [[XML]]) і покликана додати посиланням якийсь сенс, зрозумілий [[комп'ютер]]ним системам. Це дозволить перетворити [[Інтернет]] на розподілену [[База знань|базу знань]] глобального масштабу.
 
== Майбутнє семантичних мереж ==
 
: [[Семантична мережа|Семантичні мережі]] — відносяться до моделей класичного представлення знань у задачах штучного інтелекту. Семантичні мережі, як універсальний підхід, зазнав широкого застосування у побудові навчальних систем, систем машинного перекладу та семантичних павутинах. Цей підхід базується на трьох основних складових: суб'єкт, відношення, об'єкт. Саме ці три складові є базовими блоками семантичних мереж.
Починаючи з 50-х років минулого століття, семантичні мережі почали активно досліджувати все більше і більше. Першопочатковим призначенням та метою створення семантичних мереж була роль посередництва між людською мовою та системами машинного перекладу, але з плином часу задачі доповнювалися та ускладнювалися, чим викликають інтерес до себе в сьогоденні та викликатимуть його й надалі. Серед основних досліджуваних перспективних, але в той же час і проблемних напрямків розвитку у даній галузі можна виділити наступні:
* '''задача штучного інтелекту для морфологічного аналізу текстів''' — задача, що має на меті вирішення проблеми комп'ютерного аналізу текстів на основі аналогій та порівнянь;
* '''задача створення глобальної семантичної павутини''' — задача, що повинна вирішити проблему представлення всесвітньо-глобальної інформації у вигляді зрозумілому для машинної обробки та пошуку;
* '''задача створення онтологій''' для освіти та створення концепцій для навчальних Internet-систем.
 
=== Задача штучного інтелекту для морфологічного аналізу текстів ===
: В основі розв'язку даної задачі лежить представлення значення тексту у формі асоціативної семантичної мережі, у яку потрапляють найбільш вживані слова цього тексту, тобто несуть інформаційний зміст. Для кожного значення, що потрапляє у семантичну мережу будується асоціативні зв'язки — із іншими смисловими значеннями для котрих зустрічалося поточне значення, чим частіше значення потрапляють у семантичну мережу, тим більша ймовірність їхньої зв'язності по змісту.
У роботі<ref name="r1" /> описано принципи побудови алгоритмів морфологічного аналізу текстів базуючись на основі принципу аналогій. Цей алгоритм ґрунтується на орфографічному контролі та автоматичному індексуванні документів. Основною проблемою, що заставляє задумуватися науковців, є наявність нових, незрозумілих машині слів у тексті. Тобто у словнику системи відсутні множина деяких слів, в результаті чого система, що базується на принципі аналогій, не в змозі здійснити синтаксичний аналіз таких слів, а як наслідок робить неможливим знаходження розв'язку задачі пошуку граматичного значення слова. Описана вище проблема є досить актуальною на сьогоднішній день, вона унеможливлює знаходження повного вирішення задачі морфологічного аналізу текстів.
Починаючи із 1978 року і по сьогоднішній день науковці намагаються знайти рішення цієї проблеми. Так у 1978 Перейрой (Pereira) та Уорренс(D. Uorren) запропонували для вирішення задачі граматичного розбору використати логічну мову [[Prolog|PROLOG]]<ref name="r2"/>. Було розроблено ряд систем, що мали на меті віднайти рішення цієї проблеми, але кожна система володіла рядом недоліків і, як наслідок, жодній із них так і не вдалося в повній мірі реалізувати вирішення проблеми.
 
Таким чином розвиток семантичних мереж у майбутньому дозволив би нам вирішити ці проблеми і допоміг би аналітикам знайти рішення для ряду задач, серед яких:
* пошук у документах прихованих зв'язків між об'єктами — темами, пошук споріднених документів, що відповідають певній тематиці;
* пошук нових інформаційних джерел, пов'язаних із конкретною об'єктною темою, виявлення асоціативних зв'язків, що зв'язують дану об'єктну тему;
* пошук певного конкретного тематичного змісту у цілій колекції документів, що дозволить фокусуватися лише на тих темах із множини, які є спорідненими із базовою тематикою.
 
: Задача створення всесвітньо глобальної семантичної павутини виникла у середині 90-х років минулого століття. Дана задача мала і має на меті перетворення глобальної гіпертекстової мережі у єдину та унікальну семантичну систему, що отримала б назву «[[Семантична павутина]]» або «Семантичний Web».
 
=== Ідея створення [[Семантична павутина|семантичної павутини]] ===
Основна ідея створення семантичної павутини полягає в тому, що, на відмінну від існуючої гіпертекстової мережі, яку обробляє людина, семантична глобальна мережа майбутнього повинна б була представити інформацію таким чином, щоб її можна було обробляти автоматично без втручання людини. Як відомо існуюча на сьогоднішній день глобальна павутина базується на інформації представленій гіпертекстовою мовою розмітки і представляється людині через спеціально розроблені для цього засоби, зокрема браузери. На зміну цьому старому підходу, семантична павутина покликана представити наявну на сьогоднішній день інформацію у формі семантичних мереж, використовуючи при цьому, як сказано у статті<ref name="r3"/>, формалізацію областей знань з допомогою концептуальних схем, що в свою чергу складається із структур даних (об'єктів, зв'язків між ними і правил), прийнятих у даній області.
 
: Першовідкривачем та засновником поняття семантичної павутини був [[Тім Бернерс-Лі|Тім Бернерс-Лі (Berners-Lee T)]]. Так у 2001 році була опублікована його стаття, що носила назву «Наступний крок у розвитку Всесвітньої павутини». [[Тім Бернерс-Лі]] запропонував створити надбудову до існуючої глобальної мережі, яка б перетворила існуючі дані у такий спосіб, щоб ці дані стали зрозумілими комп'ютерам. Як засіб вирішення даної задачі було запропоновано стандарт RDF (Resource Definition Framework) та RDFS (RDF Schema).
RDF специфікація передбачає створення деякої множини ресурсів, для яких визначаються зв'язки значення — властивість. Ці ресурси ідентифікуються у Web за допомогою спеціальних ідентифікаторів URI. По великому рахунку RDF семантика повинна визначати отологію конкретної предметної області. Саме онтологія з кожним роком завойовує все ширше і ширше застосування у розв'язку задачі представлення знань, семантичної адаптації інформаційних ресурсів та їх пошуку. Дана віха у розвитку специфікації концептуалізації предметної області є досить перспективною, також з її допомогою здійснюються спроби представлення ієрархічних понять. Прикладом застосування онтології у глобальній мережі є групування Web-сайтів по категоріях пошуковою системою [http://en.wikipedia.org/wiki/Yahoo! Yahoo!], групування товарів за фізичними характеристиками у Internet магазинах.
Поряд із розвитком Web технологій стрімко розвивається нова концепція — концепція соціальної семантичної павутини. Згідно з<ref name="r4"/> соціальна семантична павутина — це гілка розвитку семантично павутини, що передбачає створення та існування семантично багатих знань (semantically rich knowledge). Таким чином на сьогоднішній день розвиваються такі мови, за допомогою яких можна представити знання, серед них можна виділити: RDFS, OWL Lite, OWL DL, OWL Full. Стрімкий розвиток соціальних мереж привів до накопичення величезною кількості людей у одному місці, які в свою чергу посприяли накопиченню великої кількості структурованих даних, що в викликало спробу створення спеціально інтелектуального агента — робота, що буде оперувати цією масою інформації.
 
==== Проблематика ====
: Хоча на сьогоднішній день ця ідея існує лише в теорії та на папері, але ближнім часом вона може перетворитися в реальність, адже стимул для розробки такого агента є досить великим, потенціал також немалий, ще й до того існує безліч служб, які б хотіли оперувати такою інформацією. Таким чином соціальні семантичні павутини це є комплекс технологій, підходів, принципів і методологій поєднуючи семантичні павутини, соціальні мережі та технологію Web.
Але попри великі перспективи та зацікавленість сторін існує ряд факторів, що пригнічують стрімкий розвиток семантичних павутин. Одним із таких факторів є практична нереалізовуваність. П'ять років після народження перспективної концепції, у 2006 році сам же її засновник [[Тім Бернерс-Лі]] видав публікацію «Semantic Web Revisited», у котрій висунув гіпотезу про те, що ідея семантичних павутин може існувати як повноцінна концепція, скоріше, лише в теорії. Проблема надлишковості та дублювання даних також відіграє пригнічуючу роль. Семантичні павутини передбачають існування двох дублікатів однієї і тієї ж інформації — одна зрозуміла машині (метадані), а інша людині (XML та HTML), інакше втрачається сенс створення цієї концепції. І останній, але найбільш суттєвий фактор — це відсутність вигоди для інвесторів. Оскільки основним засобом, що приносить прибуток в Internet, є реклама, а із розвитком семантичних павутин, користувачеві буде представлятися лише та інформація, яку він шукає, то, як наслідок, прибутковість реклами знизиться.
 
== Приклади семантичних мереж ==