Обчислювальна геноміка

Обчислювальна геноміка використовує обчислювальний аналіз, щоб розшифрувати послідовності генома і пов'язані з ними дані[1], включаючи послідовності ДНК і РНК. Також обчислювальна геноміка може бути визначена як розділ біоінформатики, але з тією відмінністю, що увага приділяється аналізу повних геномів (а не окремих генів), щоб зрозуміти принципи того, як різна ДНК управляє організмом на молекулярному рівні[2].

Історія ред.

Обчислювальна геноміка почала свій розвиток одночасно з біоінформатикою. У 1960-х роках Маргарет Дейгофф і інші в Національному Біомедичному Дослідницькому фонді створили бази різних послідовностей білків для еволюційного дослідження[3]. У їх дослідженні будувалося філогенетичне дерево, яке визначило зміни, потрібні для того щоб певний білок еволюціонував в інший білок. Це привело до створення матриці замін, яка оцінює імовірність зв'язку одного білка з іншим.

Починаючи з 1980-х років, стали з'являтися бази даних з геномними послідовностями, але при цьому виникли нові проблеми при пошуку і порівнянні даних про окремі гени. На відміну від алгоритмів пошуку текстів, які використовуються на вебсайтах, при пошуку генетичної схожості необхідно виявляти послідовності, які не обов'язково ідентичні, але і просто схожі. Це привело до появи алгоритма Нідлмана — Вунша, який є алгоритмом динамічного програмування для того, щоб порівняти набори послідовностей амінокислот один з одним при використанні матриць замін, отриманих у більш ранньому дослідженні М. Дейхофф. Пізніше з'явився алгоритм BLAST, який дозволяє здійснювати швидкий і оптимізований пошук у базах цих послідовностей генів. BLAST і його модифікації — одні з найширше використовуваних алгоритмів для цієї мети[4].

Поява фрази «обчислювальна геноміка» збігається з появою повних анотованих геномів у другій половині 1990-х років. Перша щорічна конференції з питань обчислювальної геноміки була організована ученими з Інституту геномних досліджень (TIGR) в 1998, забезпечуючи форум для цієї спеціальності і ефективно відрізняючи цю галузь науки від загальніших областей геноміки або обчислювальній біології[5][6]. Уперше в науковій літературі цей термін, згідно MEDLINE, був використаний одним роком раніше (у журналі Nucleic Acids Research[7]).

Див. також ред.

Примітки ред.

  1. Koonin EV (2001) Computational Genomics, National Center for Biotechnology Information, National Library of Medicine, NIH (PubMed ID: 11267880)
  2. Computational Genomics and Proteomics at MIT. Архів оригіналу за 22 березня 2018. Процитовано 7 жовтня 2017.
  3. David Mount (2000), Bioinformatics, Sequence and Genome Analysis, pp. 2-3, Cold Spring Harbor Laboratory Press, ISBN 0-87969-597-8
  4. T.A. Brown(1999), Genomes, John Wiley & Sons, ISBN 0-471-31618-0
  5. [backPid]=67&cHash=fd69079f5e [[https://web.archive.org/web/20170107160058/http://www.jcvi.org/cms/press/press-releases/full-text/archive/2004//article/computational-genomics-conference-to-attract-leading-scientists/?tx_ttnews Архівовано 7 січня 2017 у Wayback Machine.] The 7th Annual Conference on Computational Genomics (2004)]
  6. The 9th Annual Conference on Computational Genomics (2006) [Архівовано 2007-02-12 у Wayback Machine.]
  7. A. Wagner(1997), A computational genomics approach to the identification of gene networks, Nucleic Acids Res., Sep 15;25 (18): 3594-604, ISSN 0305-1048