ПАРАЛЛЕЛЬНЫЙ АЛГОРИТМ ФИЛЬТРАЦИИ ПОВТОРОВ В ДАННЫХ NGS ILLUMINA

Перевод названия: Parallel repeats filtration algorithm of NGS Illumina data

Тип публикации: статья из журнала

Год издания: 2016

Идентификатор DOI: 10.17212/1727-2769-2016-4-7-21

Ключевые слова: параллельный алгоритм, кластеризация, биоинформатика, повторы, фильтрация, ассемблирование генома, Illumina, SPAdes, abyss, parallel algorithm, clustering, bioinformatics, repeats, filtration, Sequence assembly

Аннотация: В статье рассматривается подход предобработки фрагментов (ридов), полученных по NGS технологии, позволяющий значительно сократить объем входных данных, используемых в сборке больших геномов. Основная идея - фильтрация ридов от повторяющихся элементов, не используемых в белковом анализе данных. Разработан параллельный вероятностный алгоритм фильтрации, позволяющий значительно сократить результирующее время de Novo сборки генома с минимальной потерей кодирующей информации. Реализация алгоритма направлена на достижение максимального быстродействия. Корректность работы алгоритма и программы тестировалась на модельном растении Arabidopsis Thaliana [6], чья длина генома составляет около 140 млн пар нуклеотидных оснований (п.н.о.). Сборка генома осуществлялась геномным ассемблером SPAdes. Верификация проводилась методом выравнивания ридов РНК на полученную сборку. В результате работы программы достигнуто значительное (более 20 %) сокращение исходных данных NGS с потерей кодирующей информации в пределах 0,005 %, при уменьшении времени работы геномного ассемблера SPAdes более чем в 2 раза.

Ссылки на полный текст

Издание

Журнал: Доклады Академии наук высшей школы Российской Федерации

Выпуск журнала: 4

Номера страниц: 99-110

ISSN журнала: 17272769

Место издания: Новосибирск

Издатель: Федеральное государственное бюджетное образовательное учреждение высшего образования Новосибирский государственный технический университет

Авторы

Вхождение в базы данных

Информация о публикациях загружается с сайта службы поддержки публикационной активности СФУ. Сообщите, если заметили неточности.

Вы можете отметить интересные фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.