Відкрити головне меню

Контекстно-вільна граматика

ВизначенняРедагувати

Контекстно-вільна граматика   це четвірка  :

  •  
  •   та   скінченні множини, що не перетинаються
  •   скінченна підмножина  

При цьому, використовують такі назви:   — множина нетермінальних символів,   — множина термінальних символів,   — множина правил виводу   початковий символ. Правила   записують як  .

В лівій частині правила виводу має знаходитись одна змінна (нетермінальний символ). Формально, має виконуватись  , де  .

Розширенням КВ-граматик є стохастичні КВ граматики. Правилам виведення співставляють ймовірність використання:   де  

Нормальні формиРедагувати

Для КВ граматик визначено різні нормальні форми. В нормальних формах Чомскі (НФЧ) скорочуюють праву частину правил виводу, тобто, права частина може складатись або з одного термінального символу, або з двох нетермінальних. Якщо в лівій частині знаходиться початковий символ, права частина може породжувати порожнє слово. Існує алгоритм, який переводить довільну КВ граматику в НФЧ.

Контекстно-вільна граматика визначена в нормальній формі Грейбах (НФГ), якщо вона не породжує порожнього слова та в права частина правил виводу починається з щонайбільше одного термінального символу, слід за яким йдуть нетермінальні символи. Кожна КВ граматика, яка не породжує порожнє слово, може бути перетворена в НФГ алгоритмом.

Породжена моваРедагувати

Контекстно-вільні граматики породжують контекстно-вільні мови, тобто, кожна КВ граматика породжує КВ мову, і для кожної КВ мови існує КВ граматика, що її породжує.

Контекстно-вільну мову  , породжену КВ граматикою   позначають  , де:

 

Символом   позначають послідовність правил виводу граматики  , в результаті застосування якої отримують слово   мови  . Також  .

Контекстно-вільні мови можна розпізнати недетермінованим автоматом з магазинною пам'ятю. За умови існування детермінованого автомату, здатного розпізнати мову, її називають детермінованою КВ мовою. Ця підмножина КВ мов утворює теоретичну основу для синтаксиса багатьох мов програмування.

Контекстно-вільні мови можуть містити порожнє слово, наприклад, через правило виводу  .

ВластивостіРедагувати

Приналежність словаРедагувати

Задача визначення приналежності слова КВ мові, або визначення можливості породження слова   КВ граматикою алгоритмічно розв'язна.[1] Під час розв'язання цієї задачі можна побудувати дерево виводу. Його також називають деревом синтаксичного аналізу, а програму, яка його будує — синтаксичним аналізатором. Для кожної КВ граматики можна автоматично побудувати синтаксичний аналізатор (див. також генератор синтаксичних аналізаторів та CYK-алгоритм). Часова складність для найгіршого випадку синтаксичного аналізу довільної КВ граматики знаходиться на рівні O . Для детермінованих КВ граматик можна побудувати синтаксичний аналізатор, час роботи якого знаходиться на рівні  . Типовим прикладом застосування ефективних синтаксичних аналізаторів з лінійним часом роботи є синтаксичний аналіз вихідних текстів програм в компіляторі.

Якщо слово   мови L ( ) в граматиці   може бути отримане декілька різними способами, то таку граматику називають багатозначною. Синтаксичний аналізатор для багатозначної граматики може побудувати декілька різних дерев синтаксичного аналізу. Багатозначність не важлива для розв'язання задачі належності слова, але якщо різним деревам співставляють різне значення, то один й той самий текст може мати різні значення. Наприклад, однозначність граматики важлива для процесу компіляції, аби отримати правильний код.

БагатозначністьРедагувати

Задача розпізнавання багатозначності серед КВ граматик алгоритмічно не розв'язна.[2]. Однак існують способи перевірки на багтозначність або однозначність для деяких окремих випадків КВ граматик[3].

ЕквівалентністьРедагувати

Задача визначення еквівалентності граматик   та  , або породження ідентичних мов   алгоритмічно нерозв'язна.[4]

ПідмножинаРедагувати

Задача визначення чи породжена КВ граматикою   мова також може бути породжена іншою КВ граматикою  , тобто, чи   алгоритмічно нерозв'язна.[5]

Об'єднанняРедагувати

Об'єднання   двох КВ граматик   ( ) також КВ граматика. Тобто,  .

ПеретинРедагувати

Задача визначення приналежності перетину двох КВ граматик   до класу КВ граматик алгоритмчно не розв'язувана.[6]

ДоповненняРедагувати

Доповнення КВ граматики не контекстно-вільне.

ПрикладиРедагувати

Нехай   — КВ граматика

 
 
  складається з чотирьох правил виводу:

 

  в граматиці   можна отримати наступною послідовністю застосування правил виводу:

 

тут   — дерево виведення. Корінь дерева та проміжні вузли позначені нетермінальними символами, а листи дерева позначені термінальними символами.

Таким чином,  .

Слово   де   не належить до мови  , оскільки нетермінальний символ   не початковий, а всі слова утворені від початкового мають знаходитись посеред термінальних   та  . Формально це записують:

 

Граматика   не багатозначна.

Приклад багатозначностіРедагувати

Як приклад багатозначної граматики можна навести:  .

 
 
  містить такі правила виводу:

 

До   можна застосувати правила  ,   та  . Таким чином   — багатозначна.

Див. такожРедагувати

ПосиланняРедагувати

  1. Schöning, 2001, S.21
  2. Alfred V. Aho and Jeffrey D. Ullman. The Theory of Parsing, Translation, and Compiling. Volume 1: Parsing. — Prentice-Hall, 1972. — ISBN 0-13-914556-7.
  3. H. J. S. Basten. Ambiguity Detection Methods for Context-Free Grammars.
  4. Schöning, 2001, S.137
  5. Schöning, 2001, S.137
  6. Schöning, 2001, S.137

ЛітератураРедагувати

  • Uwe Schöning. Theoretische Informatik - kurzgefasst. — 4. — Spektrum Akademischer Verlag, 2001. — С. 13, 51. — ISBN 3-8274-1099-1.