Применение
Использование данного варианта при изучении образцов в метагеномике преследует следующие цели:
- определить состав изучаемой колонии/сообщества с точки зрения присутствия других эталонных изолированных геномов;
- охарактеризовать функции его генов;
- начать выявление возможных функциональных путей (functional pathways);
- охарактеризовать сходство или различие по сравнению с другими метагеномными образцами;
- начать характеризацию изменений в составе и функциях сообщества в связи с изменениями воздействием факторов окружающей среды;
- выделить подразделы данных на основе показателей качества и состава сообщества.
Текущий подход
Современная интегрированная система сравнительного анализа метагеномов и геномов снабжена интерактивным пользовательским веб-интерфейсом. Система включает в себя предварительные вычисления на сервере (backend precomputations) и отправку пакетных заданий из пользовательского интерфейса. Система предоставляет интерфейсы к стандартным инструментам биоинформатики (таким как BLAST, HMMER, инструменты множественного выравнивания последовательностей и филогенетики, программы поиска/предсказания генов и генных структур (gene callers), программы предсказания свойств по результатам секвенирования (sequence feature predictors)).
Планы на будущее
Управление разнородными биологическими данными в настоящее время осуществляется с помощью СУБД (например, Oracle). К сожалению, оно не масштабируется даже для текущего объема в 50 терабайт данных. Решения класса NoSQL (СУБД, существенно отличающиеся от традиционных реляционных) должны были обеспечить альтернативу, но, к сожалению, они не всегда пригодны для интерактивного использования в реальном времени или же для быстрой параллельной массовой загрузки, и иногда у них возникают проблемы с надежностью.