[МУЗЫКА] [МУЗЫКА] Итак,
мы начинаем наш курс «Введение в биоинформатику».
Определение «биоинформатика» было введено в
1970 году голландским ученым Полиной Хогевег.
Был определен ею как «изучение информатических процессов в биотических
системах».
Определения «биоинформатики» с тех пор претерпели изменения и зависят они от
того, кем они даются — программистами, биологами, математиками, статистиками,
алгоритмистами или людьми, работающими со сложными биологическими системами.
Национальный институт здоровья Америки определяет «биоинформатику» как
«исследование развития использования компьютерных программ и подходов к
расширенному использованию биологических,
медицинских и поведенческих данных, что включает хранение, организацию,
архивирование, анализ и визуализацию данных».
К этому нам также хочется добавить,
что биоинформатика уже стала наукой — наукой о биологических данных.
Целью этой науки является не только развитие алгоритмов хранения и
использования данных, но и подготовка данных для получения
наиболее важных и достоверных результатов.
Три составные части обуславливают становление и бурный рост
биоинформатики в наши дни.
Это современные и высоко производительные экспериментальные технологии,
Интернет и облачные компьютерные технологии.
Давайте вспомним о центральной догме молекулярной биологии.
Она определяет движение генетической информации в биологических системах,
от ДНК к РНК и от РНК к белкам.
Процессы транскрипций и трансляций обуславливают это движение.
Для изучения механизмов передачи информации между ДНК,
РНК и белками, и их регуляции ученые проводят эксперименты
по определению первичной структуры биологически активных молекул,
изменений, происходящих в них в зависимости от тех или
иных условий; определяют функционально значимые области молекул,
их вторичные структуры и механизмы взаимодействия молекул.
Для этого определяется первичная последовательность ДНК,
РНК и белков, мутации, происходящие в ДНК в зависимости от тех
или иных условий, кодирующие и некодирующие области ДНК,
перестройки в молекулах, проводится сравнительный анализ.
Также определению механизмов и их роли и регуляций способствует
знание структуры как белков, так и РНК, а также белок-белковых взаимодействий.
Для работы с данными, получаемых в результате всех этих экспериментов,
необходимо хорошо их понимать и уметь с ними обращаться.
Биоинформатика облегчает эту задачу, создавая программы обработки
первичных данных, их сборки, анализа, систематизации и сравнения.
Многообразие биологических подходов и задач влечет за собой и
многообразие специфических биоинформатических подходов.
Геномика вобрала в себя задачи,
связанные с функционированием молекул ДНК в клетках живых организмов.
Транскриптомика изучает поведение молекул РНК.
Протеомика охватывает все разнообразие сложных задач,
связанных с синтезом и работой белков.
Однако ДНК, РНК и белки — не единственные молекулы в клетках,
обеспечивающие ее жизненный цикл.
Необходимость понимания роли жиров и метаболитов дали
рождение еще двух «омиксам», которым нужна помощь биоинформатики.
Комплексное изучение всех этих биологически активных молекул и процессов,
в которые они вовлечены, является задачей системной биологии.
А теперь попробуйте представить себе, какое количество информации
свалится на голову бедного биолога в результате такого комплексного подхода.
Можно себе представить,
что он справится со всеми этими задачами без использования компьютеров?
Конечно, нет.
Количество нуклеотидов, депонируемых в генбанк Национального
института здоровья Америки, удваивается каждые полтора года.
Появление новых высокотехнологичных секвенсных
подходов привело к необходимости создания нового хранилища,
получившего название «Архив коротких ридов».
[МУЗЫКА]
[МУЗЫКА] [МУЗЫКА]