Передбачення структури білків

Передбачення структури білків — комп'ютерне моделювання третинної (просторової) структури білку, базуючись на його амінокислотній послідовності (первинній структурі). Ця задача є однією з найважливіших проблем в сучасній біоінформатиці. Прогрес у розвитку методів для передбачення структури білків оцінюється в рамах всесвітнього експерименту КАСП (англ. CASP), що проводиться щодругого року, починаючи з 1994 [1].

Важливість проблеми ред.

В 1960-х роках американський біохімік, Нобелівський лауреат Крістіан Анфінсен [2] спостулював термодинамічну гіпотезу, згідно з якою атоми в молекулах білка укладаються в природних умовах в термодинамічно стабільну конформацію, що відповідає мінімуму вільної енергії системи. Іншими словами, білок приймає певну просторову форму в результаті обмежень, що диктуються композицією і фізико-хімічними властивостями амінокислот, що його формують. В свою чергу, білкові молекули зі схожою просторовою структурою зазвичай відіграють схожу біологічну роль в процесах клітинного рівня. Таким чином, структура білка може розглядатися як перехідна кладка між його хімічним складом (первинною структурою) і функцією.

У наші дні великі кількості амінокислотних послідовностей білків отримуються шляхом трансляції генів з нуклеотидних послідовностей ДНК, які визначаються широкомасштабними дослідницькими проектами — такими, наприклад, як проект генетики людини (Human Genome Project). Разом з тим, методи експериментального визначення структури білка є технологічно складними, коштовними і сильно (більш ніж на два порядки) відстають у продуктивності від методів визначення хімічного складу. Так, станом на березень 2010 року майже 10 мільйонів послідовностей білків депоновано до публічних баз даних[3] і ця кількість продовжує рости швидкими темпами, в той час як зусиллями великих центрів структуральної генетики в цілому світі централізовану базу даних структур білків PDB[4] вдалося наповнити лише до 60 тисяч структур. Видається, що заповнити прогалину між кількістю послідовностей і структур білків можна лише шляхом теоретичного моделювання структури білків.

Розв'язання цієї проблеми відкриває широкий шлях до впровадження і вдосконалення різноманітних біотехнологій. У наш час[коли?] є багато прикладів, коли комп'ютерні моделі білків практично використовуються в біології і медицині, зокрема для розробки ліків. Так, знання структури білка може підказати потенційних партнерів для білкової взаємодії і тим самим підштовхнути дослідників до розробки чи вдосконалення нових ензимів чи антитіл або, наприклад, пояснити фенотипи проведених мутацій чи, альтернативно, допомогти у визначенні місця для проведення мутацій з метою зміни певних фенотипів.

Складність проблеми і типи методів моделювання ред.

Передбачення структури білків є складною задачею з багатьох причин. По-перше, кількість можливих просторових конфігурацій білків є дуже великою. По-друге, фізичні засади структуроутворення білків і їхньої стабільності є ще не до кінця зрозумілими. Для досягнення успіху в побудові моделі методи з передбачення структури повинні реалізовувати певний стратегічний план для ефективного перешуковування простору можливих структур і вибору найбільш ймовірних кандидатів на нативну структуру.

На даний час існують два головні, концептуально різні типи методів для звуження простору пошуку структурних конформацій білків: 1) інформаційні методи, що базуються на знанні, почерпнутому з експериментально визначених структур (англ. knowledge-based methods), та 2) фізичні методи, що ґрунтуються на основних принципах молекулярної динаміки (англ. modeling from the first principles або англ. ab initio modeling).

Методи першого типу використовують припущення, що шукана структура білка може бути схожою до однієї або кількох відомих структур білків, чи, принаймні, бути складеною з елементарних конструкційних блоків таких білків. Методи другого типу не використовують інформації з відомих структур, а базуються переважно на спрощених енергетичних потенціалах та використовують для моделювання наближені стратегії пошуку мінімуму енергетичного ландшафту.

Передбачення структури за зразком ред.

Якщо серед відомих структур вдається відшукати такі, для яких є підстави стверджувати, що вони можуть бути до певної міри схожими з об'єктом моделювання, то тоді їх можна використати за шаблон для побудови моделі. Цей тип методів називають моделюванням за зразком (англ. template-based modeling). Шаблони можуть бути знайдені за допомогою методів безпосереднього порівняння амінокислотних послідовностей (англ. comparative modeling methods) таких як БЛАСТ (англ. BLAST) чи ФАСТА (англ. FASTA), або більш комплексних методів для розпізнавання структурно схожих білків за слабкої або практично невикривальної послідовнісної схожості (англ. fold recognition або threading methods). Остання група методів базується на принципі, що структура є еволюційно консервативнішою, ніж послідовність, а тому іноді видається за можливе знайти споріднені білки з несхожими послідовностями, а тоді спробувати "просилити" послідовність шуканого білка через структуру шаблону. Теоретично такі білки можна викрити, сконструювавши і порівнявши послідовнісні профілі шуканого білка і відомих структур.

Моделювання за шаблоном має величезний практичний потенціал, адже якщо відома структура хоча б одного білка з якоїсь функціональної родини, то тоді можна спробувати збудувати моделі для практично кожного білка в цій родині. Із зростом бази даних структур таке моделювання стає можливим для все більшої кількості білків.

Безшаблонне передбачення білків ред.

Коли не вдається знайти шаблон для моделювання жодним з вищезазначених методів, тоді застосовуються так звані безшаблонні методи (англ. template-free або de novo methods). До безшаблонних методів належать так звані фрагментні методи та чисто фізичні методи. Безпосередня симуляція звертання білків методами молекулярної динаміки з енергетичною функцією, що враховує деталі взаємодій на атомному рівні, в наш час[коли?] Є практично нерозв'язальною через високу вимогу до обчислювальних ресурсів. Тому більшість ab initio методів використовує спрощену атомну структуру білків.

Ці методи в наш час[коли?] є менш надійними, ніж шаблонні, але вони іноді можуть сконструювати моделі, що мають загальну форму (англ. - fold), близьку до нативної структури шуканого білка.

Див. також ред.

Примітки ред.

  1. Moult, J. та ін. (1995). A large-scale experiment to assess protein structure prediction methods. Proteins: Structure Function Genetics. 23 (3): ii–iv.  {{cite journal}}: Явне використання «та ін.» у: |author= (довідка)
  2. Anfinsen C (1972). The formation and stabilization of protein structure. Biochem. J. 128 (4): 737–49. PMID 4565129. 
  3. [1]
  4. [2]

Посилання ред.