Сборщик metaFlye использует данные, получаемые по самой современной технологии секвенирования на данный момент – секвенирования длинными прочтениями. С его помощью можно решить широкий круг фундаментальных и прикладных задач, среди которых контроль процесса лечения человека и создание новых лекарств.

Программый продукт metaFlye используется при сборке метагеномов, то есть образцов ДНК микробных сообществ, полученных из различных сред, – например, из глубин океана, почвы в парке или кишечника человека. Получая сборку такого образца, можно определить, что за организмы в нем представлены и сколько их. Используя дополнительный анализ сборки, часто можно выяснить, чем эти организмы могут питаться, как взаимодействуют, какие вещества синтезируют. Все эти сведения в дальнейшем можно использовать, например, для поиска новых лекарственных средств природного происхождения, для определения причин, лежащих в основе особой плодородности почвы, при проверке хода лечения человека и во множестве других как фундаментальных, так и прикладных задач.

Геномный сборщик metaFlye предназначен для данных, которые получены по самой современной технологии секвенирования на данный момент – технологии секвенирования длинными прочтениями (long-read sequencing).  MetaFlye позволяет использовать преимущества этой технологии для сложных метагеномных данных. Это первый специализированный сборщик для метагеномов, работающий с технологиями Oxford Nanopore и PacBio.

«Стимулом к созданию metaFlye послужило отсутствие специализированного метагеномного сборщика для технологии длинных прочтений, – отмечает один из авторов проекта, старший научный сотрудник Центра алгоритмической биотехнологии СПбГУ Михаил Райко. – Эта технология уже кардинально изменила всю современную геномную науку, мы научились получать гораздо более полные сборки. Так, например, с ее помощью недавно были прочитаны и локализованы многие недостающие фрагменты генома человека (с использованием оригинального инструмента Flye и тоже с участием членов нашей лаборатории). Но для метагеномов такие данные только начали появляться, и, конечно, они потребовали специальных инструментов».

С помощью metaFlye уже были проанализированы несколько симулированных (то есть сгенерированных на компьютере, без секвенирования настоящей ДНК) и реальных метагеномных образцов из желудочно-кишечного тракта человека, коровы и овцы.  «Наибольший интерес, пожалуй, представляет образец микробиома овцы, так как он был впервые получен и исследован именно в этой работе, в то время как исходные данные секвенирования для двух других образцов взяты из работ сторонних авторов. Благодаря metaFlye в этом образце удалось собрать на порядок больше вирусных геномов и в полтора раза больше плазмид, чем при использовании лучших из существующих программ-аналогов», – прокомментировал старший научный сотрудник Центра алгоритмической биотехнологии СПбГУ Алексей Гуревич.

Другим любопытным результатом стало то, что в образце удалось собрать геномы не только бактерий и архей, но и эукариот. При этом биоинформатический анализ показал, что почти половина эукариотических геномных фрагментов относится к представителям нематод, или круглых червей. Этот результат полностью соответствует отчету о вскрытии трупа животного, в котором были обнаружены признаки паразитарной инфекции.

«Сборщик metaFlye – это инструмент для решения широкого круга задач, который будет доступен всем исследователям, работающим с подобными данными. Из конкретных проектов, выполняемых в нашей лаборатории, мы применяем сборщик для изучения состава почвы черневой тайги – уникального биоценоза Западной Сибири с аномально высокой продуктивностью», – рассказывает Алексей Гуревич.

Статья о сборщике опубликована в научном журнале Nature Methods. Публикация о metaFlye – результат коллаборации 11 российских и американских ученых, представляющих Санкт-Петербургский государственный университет, Калифорнийский университет в Сан-Диего (UCSD), Институт биоинформатики (Санкт-Петербург) и американские исследовательские центры молочных и мясных продуктов. Сам сборщик metaFlye в основном разрабатывается в UCSD. Его создатель и первый автор публикации –Михаил Колмогоров, постдок UCSD. Научный руководитель проекта – Павел Певзнер, профессор UCSD и главный научный консультант Центра алгоритмической биотехнологии СПбГУ.

Дата публикации: 07.10.2020 10:03
Дата последнего изменения: 07.10.2020 10:03