Omnition — это конвейер, предназначенный для обработки данных, полученных с помощью набора Bio-Rad Single-Cell 3’ RNA-Seq Kit или набора ddSEQ™ SureCell ATAC-Seq Library Prep Kit и протокола dsciATAC. Он выполняет дебаркодирование, выравнивание, объединение шариков, вызов ячеек и подсчет функций. Выходные данные представляют собой отчет в формате HTML и файлы для последующего биологического анализа.
Эта страница предназначена для быстрого старта. Полные руководства пользователя Omnition см. на странице:
Omnition Одноклеточная 3'-РНК-Seq
Omnition Одноклеточный ATAC-Seq
Введение в Омнишн
Установка
Системные требования
Требования к оборудованию
Требования к программному обеспечению
Скачать Омнитион
Проверка установки
Начиная
YAML-конфигурация
Запуск конвейера ATAC
Запустить конвейер РНК
Геном человека
Геном мыши
Ссылки
Бегущий Омнишн
Выходы
Программное обеспечение Omnition Analysis использует платформу Nextflow для соединения отдельных процессов и запускает процессы в виртуальных средах, называемых контейнерами, с помощью программ-контейнеров Docker или Singularity. После установки Omnition в системе, отвечающей минимальным требованиям, интеграция Nextflow с GitHub и Docker подготовит рабочие процессы без какой-либо дополнительной настройки.
Omnition предназначен для работы на локальном сервере Linux, кластере высокопроизводительных вычислений (HPC) или облачной виртуальной машине и был протестирован на 64-битных CentOS 7 и 8, Amazon Linux 2 и Ubuntu 18.04.6, 20.04 LTS. , 21.04 и 21.10 операционных систем Linux.
ПРИМЕЧАНИЕ . Хотя они могут быть функциональными, Bio-Rad не поддерживает дополнительные варианты Linux или другие версии указанных операционных систем.
подключение к Интернету
ПРИМЕЧАНИЕ . Для установки без прямого доступа в Интернет см. руководство пользователя.
Требование | Анализ последовательности ATAC | Комбинаторный анализ ATAC seq | секвенирование РНК | Рекомендуется для >=12 образцов. |
---|---|---|---|---|
Процессор | 16 | 16 | 16 | 64 |
БАРАН | 64 ГБ | 128 ГБ | 64 ГБ | 512 ГБ |
операций ввода-вывода в секунду* | 3000 | 3000 | 3000 | 16 000 |
Пропускная способность ввода-вывода* | 125 Мбит/с | 125 Мбит/с | 125 Мбит/с | 1000 Мбит/с |
Тип тома EBS* | gp3 | gp3 | gp3 | gp3 |
*Специальные характеристики облачных вычислений AWS.
Nextflow (от версий 22.04.0 до v23.10.1) или Nextflow с Conda
ПРИМЕЧАНИЕ. Укажите версию Nextflow при установке Conda с помощью следующей команды:
conda install –c bioconda nextflow=
Требуется только одна из следующих программ-контейнеров: либо Docker (>=20.10.7), либо Singularity (>=3.6.4).
ПРИМЕЧАНИЕ. При использовании Docker ваш
USER
должен быть добавлен в корневую группу пользователей Docker перед выполнением конвейера. В общих системах, таких как кластеры HPC, это может быть невозможно из-за угроз безопасности, и вместо этого конвейер следует выполнять с использованием профиля Singularity (по умолчанию). Прежде чем использовать Omnition, пользователь должен проверить у своего системного администратора, что Docker или Singularity доступны.
Чтобы загрузить и запустить Omnition, используйте nextflow для получения последней версии Omnition с GitHub.
nextflow pull BioRadOpenSource/omnition
Omnition включает небольшие демонстрационные наборы данных для проверки правильности построения среды и наличия всех зависимостей программного обеспечения. Чтобы проверить успешность установки для каждого типа анализа, запустите команду Nextflow для контейнерной системы, установленной на вашем компьютере (Singularity или Docker).
Чтобы убедиться, что каждый рабочий процесс анализа установлен правильно, выполните следующие команды с помощью Docker или Singularity.
ПРИМЕЧАНИЕ. Рабочие файлы (и выходные файлы, если не указано иное) будут создаваться в том же каталоге, из которого конвейер был запущен из командной строки.
mkdir /home/ubuntu/demo_data cd /home/ubuntu/demo_data
ПРИМЕЧАНИЕ. Указанные пути к файлам приведены в качестве примера.
Докер:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,docker --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,docker --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,docker --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,docker --catac.output /home/ubuntu/demo_data/catac
Сингулярность:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,standard --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,standard --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,standard --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,standard --catac.output /home/ubuntu/demo_data/catac
ПРИМЕЧАНИЕ. Обратите внимание на использование
-
и--
в командах выполнения. Аргументы с одним знаком-
являются аргументами Nextflow, а аргументы с--
определяемыми пользователем параметрами. Вы также можете использовать флаг Nextflow -r, чтобы указать тег git (т. е. релиз), ветку или хэш для выполнения конвейера в этом месте истории git.
ПРИМЕЧАНИЕ. При запуске следующего потока в терминале появляются случайно сгенерированные [adjective_names]. Эти имена взяты из списка, подготовленного Nextflow. Это неотъемлемая особенность nextflow, а не добавленная Bio-Rad.
По завершении выполнения вы должны увидеть сообщение о том, что оно выполнено без каких-либо неудачных задач.
Перед запуском рабочего процесса Omnition требует запуска следующих файлов:
Геномные файлы FASTA и GTF из ENSEMBL.
Эталонные последовательности генома должны быть отформатированы как файлы FASTA.
Аннотации должны быть отформатированы как файлы GTF.
Имена последовательностей в файлах FASTA и GTF должны совпадать.
Каталог с входными FASTQ
ПРИМЕЧАНИЕ. Входные справочные файлы можно сжимать как файлы gzip (.gz).
Omnition совместим со стандартами ENSEMBL. Ссылки ENSEMBL Human/GRCh38 и Mouse/GRCm39 поддерживаются Omnition. Другие виды из ENSEMBL не поддерживаются, а ссылки, полученные из других источников (NCBI, GENCODE и т. д.), несовместимы.
Ссылки на человека и мышь можно получить с помощью следующих команд.
mkdir ~/references/human cd ~/references/human
ПРИМЕЧАНИЕ. Указанные пути к файлам приведены в качестве примера.
curl -o Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz curl -o Homo_sapiens.GRCh38.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/homo_sapiens/Homo_sapiens.GRCh38.106.gtf.gz
mkdir ~/references/mouse cd ~/references/mouse
curl -o Mus_musculus.GRCm39.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/mus_musculus/dna/Mus_musculus.GRCm39.dna.primary_assembly.fa.gz curl -o Mus_musculus.GRCm39.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/mus_musculus/Mus_musculus.GRCm39.106.gtf.gz
Для конвейера требуется файл в формате YAML с путями ввода-вывода и параметрами, специфичными для анализа, когда тестовые данные не выполняются. Подробное описание содержимого файла, доступных параметров и способов их форматирования можно найти в руководстве пользователя. Примеры конфигураций YAML можно найти в папке example-yamls этого репозитория.
С сингулярностью:
nextflow run BioRadOpenSource/omnition -params-file
С Докером:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
С сингулярностью:
nextflow run BioRadOpenSource/omnition -params-file
С Докером:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
После завершения отчеты можно найти в подкаталоге results/report/
, а промежуточные файлы — в подкаталоге results/Sample_Files/
. Кроме того, в каталоге, из которого был выполнен Nextflow, будут созданы каталог кэша Nextflow ( .nextflow/
) и рабочий каталог ( work/
). Это позволяет возобновить прерванный/неудавшийся анализ с точки сбоя. Если вы хотите продолжить выполнение, добавьте -resume
к командам выполнения ниже. Вы можете удалить кеш и рабочие каталоги, чтобы сэкономить место после завершения, но это заблокирует функцию -resume
.
Вернуться наверх