Strelka2 - это быстрый и точный малый вариант -вызывающий вызывающий, оптимизированный для анализа изменений зародышевой линии в небольших когортах и соматического изменения в парах опухоли/нормальных образцов. Абонент зародышевой линии использует эффективную многоуровневую модель гаплотипов для повышения точности и обеспечения фазирования, поддерживаемого чтением, адаптивного выбора между сборкой и более быстрым подходом на основе выравнивания в каждом локусе варианта. Вызывающий абонент зародышевой линии также анализирует данные входного секвенирования с использованием метода оценки ошибок в моделе смеси для повышения устойчивости к шуму. Модель соматического вызова улучшает исходный метод Strelka для анализа жидкости и поздней стадии, учитывая возможное загрязнение опухолевых клеток в нормальном образце. Последний эмпирический вариант повторного балла с использованием моделей случайных лесов, обученных различным функциям качества вызовов, был добавлен к обоим вызывающим абонентам для дальнейшего повышения точности.
По сравнению с представлениями о недавних согласованности PrecisionFDA и проблемах истины, средний F-оценка Indel для Strelka2, работающего в его конфигурации по умолчанию, на 3,1% и 0,08% выше, чем наилучшие вызова. Средство выполнения на 28-ядерном сервере составляет ~ 40 минут для анализа зародышевой линии 40x WGS и ~ 3 часа для соматического анализа с опухолью-нормальным опухолью 110x/40x WGS. Более подробная информация о методах Strelka2 и сравнительном анализе как для зародышевой линии, так и для соматического вызова описана в:
Kim S., Scheffler, K. et al. (2018) Strelka2: Быстрое и точное призыв зародышевой линии и соматических вариантов. Методы природы , 15, 591-594. doi: 10.1038/s41592-018-0051-x
... и соответствующий предварительный напечаток с открытым доступом
Срелька принимает отображения чтения ввода из файлов BAM или CRAM, а также, необязательно кандидаты и/или аллели принудительного вызова от VCF. Он сообщает о всех небольших прогнозах варианта в формате VCF 4.1. Отчеты варианта зародышевой линии используют конвенции GVCF для представления как варианта, так и достоверности справочного вызова. Для лучшей соматической производительности Indel, Strelka предназначена для запуска со структурным вариантом Manta и Andel Caller, который предоставляет дополнительные кандидаты в инделе до заданного максимального размера индела (49 по умолчанию). По дизайну, Manta и Strelka работают вместе с настройками по умолчанию, обеспечивают полное покрытие по всем размерам индел (в дополнение к SVS и SNVS). См. Руководство пользователя для полного описания возможностей и ограничений.
Чтобы начать установку и использование Strelka, пожалуйста, проконсультируйтесь с руководством быстрого старта.
После завершения установки и просмотра руководства быстрого начала см. Руководство пользователя Strelka для полных инструкций о том, как запустить Strelka, интерпретировать результаты и оценить требования к аппаратному обеспечению/вычисления, в дополнение к обзору методов высокого уровня.
Исходный код Strelka предоставляется в соответствии с лицензией GPLV3. Срелька включает в себя несколько сторонних пакетов, предоставленных по другим лицензиям с открытым исходным кодом, см. Copyright.txt для получения дополнительной информации.
Для деталей разработки и отладки кода Strelka см. Руководство по разработчике Strelka. Это включает в себя подробную информацию о протоколах развития Стрелки, специальных инструкциях по сборке, рекомендуемым рабочим процессам для расследования звонков и деталях внутренней документации.