Обчислювальна біологія
Обчислювальна біологія — міждисциплінарна газуль науки, що утворюється на співпраці біології та обчислювальної науки[en], спрямована на розуміння біологічних систем за допомогою обчислювальних методів і інструментів.
Обчислювальна біологія використовує досягнення інформатики, обчислювальної техніки, прикладної математики і статистики для аналізу біологічних даних, моделювання біологічних процесів, розуміння механізмів, що лежать в основі біологічних явищ, та вирішення біологічних та біомедичних проблем.
Використовуючи алгоритми, статистичні моделі та комп’ютерне моделювання, обчислювальна біологія вирішує різноманітні біологічні питання, від розуміння генетичних послідовностей і молекулярних структур до вивчення складних біологічних мереж і систем.
Сфери досліджень і застосувань
ред.Обчислювальна біологія відіграє вирішальну роль у наукових відкриттях в науках про життя і має практичне застосування в різних областях, включаючи розробку ліків, персоналізовану медицину, сільськогосподарську біотехнологію та дослідження навколишнього середовища. Її міждисциплінарний характер сприяє співпраці між біологами, інформатиками, математиками та іншими фахіфцями, що веде до інноваційних підходів у біологічних дослідженнях і значно сприяє нашому розумінню життєвих процесів.
Головними сферами в біології та біомедицині, які застосовують методи обчислювальної біології, є:
- Біоінформатика — міждисциплінарна галузь науки, яка поєднує принципи біології, інформатики, математики та статистики для збору, аналізу, інтерпретації та керування біологічними даними. Біоінформатика тісно пов'язана з обчислювальною біологією, і зосереджена на розробці та використанні обчислювальних методів, алгоритмів і програмних засобів для вилучення значущої інформації з величезних і складних наборів біологічних даних, зокрема в геноміці, епігеноміці, протеоміці та інших дисциплінах оміксних аналізів, та їх інтегративного аналізу — мультиоміки.
- Обчислювальна геноміка, підрозділ геноміки, який вивчає геноми клітин і організмів за допомогою високопродуктивного геномного секвенування (що вимагає значної подальшої обробки — так званої збірки геному), і який використовує метод ДНК-мікрочипів для статистичного аналізу виражених в конкретних типах клітин генів.
- Мультиоміка — це підхід до біологічного аналізу, спрямований на використання та інтеграцію великої кількості даних, наданої оміксними дослідженнями – «омами», такими як геном, епігеном, транскриптом, протеом, епітранскриптом, метаболом і мікробіом (мета-геном, мета-транскриптом, мета-протеом та ін.), інтерактом тощо, щоб розвинути комплексне розуміння біологічних систем.[1][2][3][4]
- Математична біологія (або обчислювальне біомоделювання), підрозділ біокібернетики, що займається побудовою обчислювальних моделей біологічних систем.
- Молекулярне моделювання, область досліджень, яка привертає теоретичні і обчислювальні методи для моделювання або імітації поведінки молекул, причому молекул в найширшому сенсі — що полягають від декількох атомов і до «гігантських» біологічних ланцюжків.
- Системна біологія, що ставить за мету моделювання повномасштабних біологічних сигнальних систем і систем передачі сигналів (для цілої клітини або навіть цілого організму), часто використовуючи методи біомоделювання (математичної біології) та методів аналізу електротехнічних мереж.
- Передбачення структури білків і структурна геноміка — роблять спроби обчислювати точні тривимірні моделі структур білків, які не були отримані експериментальним шляхом.
- Обчислювальні підрозділи біохімії і біофізики, що широко використовують структурне моделювання і імітаційні методи, такі як молекулярна динаміка або методи засновані на методі Монте-Карло, в спробі пролити світло кінетику і термодинаміку роботи білків.
Історія
ред.Деякі важливі для галузі обчислювальної біології історичні відкриття й досягнення:
- 1953: Джеймс Уотсон і Френсіс Крік пропонують структуру подвійної спіралі ДНК, з’ясовуючи фундаментальну основу зберігання генетичної інформації.[5]
- Початок 1960-х років: Маргарет Дейгоф[en] стала піонером обчислювальної біології, започаткувавши аналіз амінокислотної послідовності білків і методології передбачення структури білків.[6]
- 1981: Вотермен[en] і Сміт[en] винаходять алгоритм Сміта-Вотермена[en], для локального вирівнювання послідовностей, революціонізуючи порівняння та аналіз послідовностей[en].[7]
- 1980-ті: Нідлман і Вунш розробляють алгоритм Нідлмена-Вунша для глобального вирівнювання послідовностей, що дозволяє ефективно порівнювати цілу ДНК або білкову послідовність.[8]
- 1990: Проєкт геному людини — міжнародна наукова ініціатива, започаткована в 1990 році з метою картографування та секвенування всього геному людини, ідентифікації та визначення послідовності пар нуклеотидних основ, які складають ДНК людини. Цей монументальний проект, завершений у 2003 році, надав вичерпну довідкову інформацію для розуміння генетичного плану людського життя, пропонуючи розуміння генів, спадкових рис і основи різноманітних генетичних розладів і захворювань.[9][10]
- 2001: Крейг Вентер та величезна команда дослідників Проєкту геному людини опублікували першу повну послідовність геному людини, розвиваючи геномні дослідження та обчислювальні методи аналізу даних.[11]
- 2003: стартував Проєкт епігеному людини[en], задля того, щоб скласти карту та зрозуміти епігеном — епігенетичний ландшафт геному людини, за аналогією Проєкту геному людини.[12]
- 2009: Ерез Ліберман-Айден[en] і його колеги описали в журналі Science метод Hi-C[en], який досліджує тривимірну архітектуру цілих геномів шляхом поєднання лігування на основі близькості з масивним паралельним секвенуванням[en].[13]
- 2010: Барбара Енгельхардт[en] і її колеги розробляють інноваційні методи статистичної геноміки для генетики популяцій.[14]
- 2012: Еммануель Шарпентьє та Дженніфер Даудна розробляють систему редагування генів CRISPR-Cas9, що революціонізує генетичні маніпуляції та можливості лікування.[15] За цей винахід вони отримали Нобелівську премію з хімії у 2020 році та цілу низку престижних наукових нагород та відзнак.[16][17]
- 2013: Майкл Левітт, Мартін Карплус і Ар’є Варшель отримують Нобелівську премію з хімії за розробку багатомасштабних моделей для складних хімічних систем.
- 2016: Фен Чжан і його колеги розробляють систему CRISPR-Cas13 для редагування РНК, розширюючи можливості редагування цільових послідовностей РНК.[18]
- 2018: AlphaFold[en], розроблений компанією DeepMind, досяг новаторської точності у передбаченні білкових структур за допомогою штучного інтелекту та глибокого навчання.[19]
- 2018: Авів Регев[en] та величезна команда колег оприлюднили першу частину Атласу людських клітин[en], в якому планується відобразити кожен тип клітин людського тіла, використовуючи одноклітинну[en] геноміку та обчислювальний аналіз.[20][21][22]
Моделювання
ред.Пакет молекулярної динаміки NAMD[en] та програмне забезпечення для візуалізації VMD[en] біофізика Шультен використовують щонайменше 300 000 дослідників у всьому світі.
У 2006 з'явилася модель ікосаедричного вірусу супутника тютюнової мозаїки (STMV). Вперше було створено повну модель, яка вимагала ресурсів Національного центру суперкомп'ютерних додатків в Урбані[23] (розмір: 1 млн атомів, час моделювання: 50 нс, програма: NAMD). Моделювання забезпечило нове уявлення про механізми збірки вірусу. Вся частинка STMV складається з 60 однакових копій одного білка, з яких складається капсиди (оболонки), і 1063 нуклеотидного одноланцюгового РНК генома. Одним із ключових висновків те, що капсид дуже нестабільний, коли всередині немає РНК, тобто вірус, який виглядає симетрично на нерухомих зображеннях, насправді імпульсує та асиметричний. Капсида залежить від генетичного матеріалу в РНК-ядрі частинки і руйнується без нього. Це засвідчило, що перш ніж вірус зможе побудувати свою оболонку при розмноженні, повинен бути присутнім генетичний матеріал.
В 2013 році Шультен змоделював капсид ВІЛ (з 64 мільйонів атомів) за допомогою суперкомп'ютера Blue Waters.
У 2015 з'явилась модель світловідбиваючої клітини хроматофор пурпурової фотосинтезуючі бактерії Purpurbakterie (близько 100 мільйонів атомів)[24] за допомогою суперкомп'ютера Титан в Національній лабораторії Oak Ridge. У моделюванні процесів перетворення сонячного світла в хімічну енергію брали участь 100 мільйонів атомів, 16000 ліпідів і 101 білок, хоча вміст крихітної органели займає лише один відсоток від загального обсягу клітини.
Шультен планував більш масштабні моделювання на суперкомп'ютері SUMMIT.
У жовтні 2017 з'явився фреймворк OpenFermion Cirq [en], перша платформа з відкритим кодом для перекладу проблем хімії та матеріалознавства в квантові схеми. OpenFermion — це бібліотека для моделювання систем взаємодіючих електронів (ферміонів), що породжують властивості речовини[25][26]. До OpenFermion розробникам квантових алгоритмів потрібно було вивчити значну кількість хімії та написати велику кількість коду, щоб зламати інші коди, щоб скласти навіть найосновніші квантові симуляції.
Прикладом успішних досягнень обчислювальної біології можна вважати деякі проєкти подібних World Community Grid розподілених мереж.
Далі приклади волонтерських проєктів з обчислювальної біології, в яких можна взяти участь:
- Folding@home - це проєкт, який досліджує структуру білків і їх взаємодії з ліками та хворобами, такими як рак, цукровий діабет та COVID-19. Кожен може стати волонтером та використовувати свій комп'ютер, щоб допомогти в обробці великих обсягів даних.
- Rosetta@home - це ще один проєкт з вивчення структури білків. Волонтери можуть використовувати свій комп'ютер, щоб моделювати складні молекулярні системи, які допомагають в розумінні хімії життя та розробці нових ліків.
- BOINC - це платформа для волонтерських проєктів з обчислювальної науки, включаючи біологію. До проєктів, які можна підключитися, належать World Community Grid, який досліджує хвороби, такі як рак, малярія та туберкульоз, та GPUGRID, який вивчає структуру білків та використовує їх для розробки нових ліків.
- Phylo[en] - це волонтерський проєкт з обчислювальної біології, який досліджує еволюційну історію генів. Волонтери можуть грати в гру, де їхні рухи допомагають у побудові дерева філогенетичного дерева, яке вказує на еволюційні зв'язки між генами.
Ці проєкти відкриті для всіх бажаючих та дозволяють внести свій вклад у розвиток науки, допомагаючи досліджувати складні біологічні системи та розробляти нові ліки.
Див. також
ред.- Біоінформатика
- Моделювання біологічних систем
- Мультиоміка
- Клаус Шультен
- Крейг Вентер
- Синтетична біологія
- Цифровий організм
- Порівняння програмного забезпечення для моделювання молекулярної механіки[en]
- Петафлопсні обчислення[en]
- Грубозернисте моделювання[en]
- Модель клітини[en]
- Молекулярне моделювання на графічних процесорах[en]
- Візуалізація біологічних даних[en]
Додаткова література
ред.Книги
ред.- Серія книг Computational Biology (Springer, 2001-2023+)
Журнали
ред.Наукові журнали, що охоплюють теми обчислювальної біології включають наступні, а також біоінформатичні журнали (див. Біоінформатика):
- PLOS Computational Biology (сайт)
- Journal of Computational Biology
- Nature Computational Science
- IEEE/ACM Transactions on Computational Biology and Bioinformatics
- Computational Biology and Chemistry
- Molecular Systems Biology
Статті
ред.- Інформаційна біологія [Архівовано 14 березня 2016 у Wayback Machine.] //Фармацевтична енциклопедія
Примітки
ред.- ↑ Hasin, Yehudit; Seldin, Marcus; Lusis, Aldons (5 травня 2017). Multi-omics approaches to disease. Genome Biology. Т. 18, № 1. с. 83. doi:10.1186/s13059-017-1215-1. ISSN 1474-760X. PMC 5418815. PMID 28476144. Процитовано 11 червня 2023.
{{cite news}}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання) Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання) - ↑ Bersanelli, Matteo; Mosca, Ettore; Remondini, Daniel; Giampieri, Enrico; Sala, Claudia; Castellani, Gastone; Milanesi, Luciano (1 січня 2016). Methods for the integration of multi-omics data: mathematical aspects. BMC Bioinformatics. 17 (2): S15. doi:10.1186/s12859-015-0857-9. ISSN 1471-2105. PMC 4959355. PMID 26821531.
{{cite journal}}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання) - ↑ Bock, Christoph; Farlik, Matthias; Sheffield, Nathan C. (August 2016). Multi-Omics of Single Cells: Strategies and Applications. Trends in Biotechnology. 34 (8): 605—608. doi:10.1016/j.tibtech.2016.04.004. PMC 4959511. PMID 27212022.
- ↑ Vilanova, Cristina; Porcar, Manuel (26 липня 2016). Are multi-omics enough?. Nature Microbiology. 1 (8): 16101. doi:10.1038/nmicrobiol.2016.101. PMID 27573112.
- ↑ Watson, J. D.; Crick, F. H. C. (1953-04). Molecular Structure of Nucleic Acids: A Structure for Deoxyribose Nucleic Acid. Nature (англ.). Т. 171, № 4356. с. 737—738. doi:10.1038/171737a0. ISSN 1476-4687. Процитовано 20 грудня 2023.
- ↑ M.O. Dayhoff. Atlas of Protein Sequence and Structure (PDF).
- ↑ Smith, T.F.; Waterman, M.S. (1981-03). Identification of common molecular subsequences. Journal of Molecular Biology (англ.). Т. 147, № 1. с. 195—197. doi:10.1016/0022-2836(81)90087-5. Процитовано 20 грудня 2023.
- ↑ Needleman, Saul B.; Wunsch, Christian D. (1970-03). A general method applicable to the search for similarities in the amino acid sequence of two proteins. Journal of Molecular Biology (англ.). Т. 48, № 3. с. 443—453. doi:10.1016/0022-2836(70)90057-4. Процитовано 20 грудня 2023.
- ↑ Watson, James D. (6 квітня 1990). The Human Genome Project: Past, Present, and Future. Science (англ.). Т. 248, № 4951. с. 44—49. doi:10.1126/science.2181665. ISSN 0036-8075. Процитовано 20 грудня 2023.
- ↑ Powledge, Tabitha M (2003). Human genome project completed. Genome Biology (англ.). Т. 4. с. spotlight–20030415–01. doi:10.1186/gb-spotlight-20030415-01. ISSN 1465-6906. Процитовано 20 грудня 2023.
{{cite news}}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання) - ↑ Venter, J. Craig; Adams, Mark D.; Myers, Eugene W.; Li, Peter W.; Mural, Richard J.; Sutton, Granger G.; Smith, Hamilton O.; Yandell, Mark; Evans, Cheryl A. (16 лютого 2001). The Sequence of the Human Genome. Science (англ.). Т. 291, № 5507. с. 1304—1351. doi:10.1126/science.1058040. ISSN 0036-8075. Процитовано 20 грудня 2023.
- ↑ Bradbury, Jane (22 груд. 2003 р.). Human Epigenome Project—Up and Running. PLOS Biology (англ.). Т. 1, № 3. с. e82. doi:10.1371/journal.pbio.0000082. ISSN 1545-7885. PMC 300691. PMID 14691553. Процитовано 20 грудня 2023.
{{cite news}}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання) Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання) - ↑ Lieberman-Aiden, Erez; van Berkum, Nynke L.; Williams, Louise; Imakaev, Maxim; Ragoczy, Tobias; Telling, Agnes; Amit, Ido; Lajoie, Bryan R.; Sabo, Peter J. (9 жовтня 2009). Comprehensive Mapping of Long-Range Interactions Reveals Folding Principles of the Human Genome. Science (англ.). Т. 326, № 5950. с. 289—293. doi:10.1126/science.1181369. ISSN 0036-8075. PMC 2858594. PMID 19815776. Процитовано 20 грудня 2023.
{{cite news}}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання) - ↑ Engelhardt, Barbara E.; Stephens, Matthew (16 вересня 2010). Walsh, Bruce (ред.). Analysis of Population Structure: A Unifying Framework and Novel Methods Based on Sparse Factor Analysis. PLoS Genetics (англ.). Т. 6, № 9. с. e1001117. doi:10.1371/journal.pgen.1001117. ISSN 1553-7404. PMC 2940725. PMID 20862358. Процитовано 20 грудня 2023.
{{cite news}}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання) Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання) - ↑ Jinek, Martin; Chylinski, Krzysztof; Fonfara, Ines; Hauer, Michael; Doudna, Jennifer A.; Charpentier, Emmanuelle (17 серпня 2012). A Programmable Dual-RNA–Guided DNA Endonuclease in Adaptive Bacterial Immunity. Science (англ.). Т. 337, № 6096. с. 816—821. doi:10.1126/science.1225829. ISSN 0036-8075. PMC 6286148. PMID 22745249. Процитовано 20 грудня 2023.
{{cite news}}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання) - ↑ Jinek, Martin; Chylinski, Krzysztof; Fonfara, Ines; Hauer, Michael; Doudna, Jennifer A.; Charpentier, Emmanuelle (17 серпня 2012). A Programmable Dual-RNA–Guided DNA Endonuclease in Adaptive Bacterial Immunity. Science (англ.). Т. 337, № 6096. с. 816—821. doi:10.1126/science.1225829. ISSN 0036-8075. PMC 6286148. PMID 22745249. Процитовано 6 серпня 2023.
{{cite news}}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання) - ↑ Doudna, Jennifer A.; Charpentier, Emmanuelle (28 листопада 2014). The new frontier of genome engineering with CRISPR-Cas9. Science (англ.). Т. 346, № 6213. doi:10.1126/science.1258096. ISSN 0036-8075. Процитовано 6 серпня 2023.
- ↑ Cox, David B. T.; Gootenberg, Jonathan S.; Abudayyeh, Omar O.; Franklin, Brian; Kellner, Max J.; Joung, Julia; Zhang, Feng (24 листопада 2017). RNA editing with CRISPR-Cas13. Science (англ.). Т. 358, № 6366. с. 1019—1027. doi:10.1126/science.aaq0180. ISSN 0036-8075. PMC 5793859. PMID 29070703. Процитовано 20 грудня 2023.
{{cite news}}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання) - ↑ Jumper, John; Evans, Richard; Pritzel, Alexander; Green, Tim; Figurnov, Michael; Ronneberger, Olaf; Tunyasuvunakool, Kathryn; Bates, Russ; Žídek, Augustin (2021-08). Highly accurate protein structure prediction with AlphaFold. Nature (англ.). Т. 596, № 7873. с. 583—589. doi:10.1038/s41586-021-03819-2. ISSN 1476-4687. Процитовано 20 грудня 2023.
- ↑ Rozenblatt-Rosen, Orit; Stubbington, Michael J. T.; Regev, Aviv; Teichmann, Sarah A. (2017-10). The Human Cell Atlas: from vision to reality. Nature (англ.). Т. 550, № 7677. с. 451—453. doi:10.1038/550451a. ISSN 1476-4687. Процитовано 20 грудня 2023.
- ↑ Regev, Aviv; Teichmann, Sarah A; Lander, Eric S; Amit, Ido; Benoist, Christophe; Birney, Ewan; Bodenmiller, Bernd; Campbell, Peter; Carninci, Piero (5 грудня 2017). The Human Cell Atlas. eLife (англ.). Т. 6. doi:10.7554/eLife.27041. ISSN 2050-084X. PMC 5762154. PMID 29206104. Процитовано 20 грудня 2023.
{{cite news}}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання) Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання) - ↑ Rood, Jennifer E.; Maartens, Aidan; Hupalowska, Anna; Teichmann, Sarah A.; Regev, Aviv (2022-12). Impact of the Human Cell Atlas on medicine. Nature Medicine (англ.). Т. 28, № 12. с. 2486—2496. doi:10.1038/s41591-022-02104-7. ISSN 1546-170X. Процитовано 20 грудня 2023.
- ↑ Molecular Dynamics of Viruses. www.ks.uiuc.edu. Архів оригіналу за 21 жовтня 2021. Процитовано 1 травня 2021.
- ↑ Koepke, Juergen; Hu, Xiche; Muenke, Cornelia; Schulten, Klaus; Michel, Hartmut (1 травня 1996). The crystal structure of the light-harvesting complex II (B800–850) from Rhodospirillum molischianum. Structure (English) . Т. 4, № 5. с. 581—597. doi:10.1016/S0969-2126(96)00063-9. ISSN 0969-2126. PMID 8736556. Архів оригіналу за 30 червня 2013. Процитовано 1 травня 2021.
- ↑ Архівована копія. Архів оригіналу за 29 квітня 2021. Процитовано 1 травня 2021.
{{cite web}}
: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання) - ↑ Архівована копія. Архів оригіналу за 1 травня 2021. Процитовано 1 травня 2021.
{{cite web}}
: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання)