Omnition es una tubería diseñada para procesar datos generados con el kit ddSEQ™ Single-Cell 3' RNA-Seq de Bio-Rad o el kit de preparación de biblioteca ddSEQ™ SureCell ATAC-Seq y el protocolo dsciATAC. Realiza eliminación de códigos de barras, alineación, fusión de cuentas, llamadas de células y recuento de funciones. El resultado es un informe HTML y archivos para análisis biológicos posteriores.
Esta página pretende ser un comienzo rápido. Para obtener las guías de usuario completas de Omnition, consulte:
Omnition unicelular 3' RNA-Seq
Omnition ATAC-Seq de celda única
Introducción a la omnición
Instalación
Requisitos del sistema
Requisitos de hardware
Requisitos de software
Descargar Omnición
Verificar la instalación
Empezando
configuración yaml
Ejecute el oleoducto ATAC
Ejecutar canalización de ARN
genoma humano
Genoma del ratón
Referencias
Ejecutando Omnición
Salidas
Omnition Analysis Software utiliza el marco Nextflow para conectar procesos individuales y ejecuta los procesos en entornos virtuales llamados contenedores utilizando los programas de contenedores Docker o Singularity. Una vez que Omnition esté instalado en un sistema que cumpla con los requisitos mínimos, la integración de Nextflow con GitHub y Docker preparará los flujos de trabajo sin ninguna configuración adicional.
Omnition está diseñado para ejecutarse en un servidor Linux local, un clúster de computación de alto rendimiento (HPC) o una máquina virtual en la nube, y ha sido probado en CentOS 7 y 8 de 64 bits, Amazon Linux 2 y Ubuntu 18.04.6, 20.04 LTS. , 21.04 y 21.10 sistemas operativos Linux.
NOTA : Aunque pueden ser funcionales, Bio-Rad no admite variantes adicionales de Linux ni otras versiones de los sistemas operativos especificados.
conexión a internet
NOTA : Para la instalación sin acceso directo a Internet, consulte el manual del usuario.
Requisito | Análisis de secuencia ATAC | Análisis combinatorio de secuencias ATAC. | análisis de secuencias de ARN | Recomendado para muestras >=12x |
---|---|---|---|---|
UPC | 16 | 16 | 16 | 64 |
RAM | 64GB | 128GB | 64GB | 512GB |
IOPS* | 3.000 | 3.000 | 3.000 | 16.000 |
Rendimiento de E/S* | 125mbps | 125mbps | 125mbps | 1.000mbps |
Tipo de volumen EBS* | gp3 | gp3 | gp3 | gp3 |
*Especificaciones de computación en la nube específicas de AWS
Nextflow (v22.04.0 a v23.10.1) o Nextflow con Conda
NOTA: Especifique la versión de Nextflow en la instalación de Conda usando el siguiente comando:
conda install –c bioconda nextflow=
Solo se necesita uno de los siguientes programas contenedores: Docker (>=20.10.7) o Singularity (>=3.6.4)
NOTA: Si utiliza Docker, su
USER
debe agregarse al grupo de usuarios raíz de Docker antes de ejecutar la canalización. En sistemas compartidos, como clústeres HPC, es posible que esto no sea posible debido a riesgos de seguridad y la canalización debe ejecutarse utilizando el perfil Singularity (predeterminado) en su lugar. El usuario debe verificar con su administrador del sistema que Docker o Singularity estén disponibles antes de usar Omnition.
Para descargar y ejecutar Omnition, use nextflow para recuperar la última versión de Omnition de GitHub.
nextflow pull BioRadOpenSource/omnition
Omnition incluye pequeños conjuntos de datos de demostración para verificar que el entorno se haya creado correctamente y que todas las dependencias del software estén en su lugar. Para verificar el éxito de la instalación para cada tipo de análisis, ejecute el comando Nextflow para el sistema contenedor que está instalado en su computadora (Singularity o Docker).
Para verificar que cada flujo de trabajo de análisis esté instalado correctamente, ejecute los siguientes comandos con Docker o Singularity.
NOTA: Los archivos de trabajo (y los archivos de salida, a menos que se especifique lo contrario) se generarán en el mismo directorio desde el que se ejecutó la canalización en la línea de comando.
mkdir /home/ubuntu/demo_data cd /home/ubuntu/demo_data
NOTA: Las rutas de archivos especificadas son a modo de ejemplo.
Estibador:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,docker --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,docker --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,docker --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,docker --catac.output /home/ubuntu/demo_data/catac
Singularidad:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,standard --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,standard --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,standard --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,standard --catac.output /home/ubuntu/demo_data/catac
NOTA: Tenga en cuenta el uso de
-
y--
en los comandos de ejecución. Los argumentos con un solo-
delante son argumentos de Nextflow y aquellos con--
son parámetros definidos por el usuario. También puede usar el indicador Nextflow -r para especificar una etiqueta git (es decir, liberación), rama o hash para ejecutar la canalización en ese punto del historial de git.
NOTA: Al iniciar una ejecución de nextflow, aparecerán [adjective_names] generados aleatoriamente en la terminal. Estos nombres provienen de una lista preparada por Nextflow. Esta es una característica inherente de nextflow, no algo agregado por Bio-Rad.
Cuando finalice la ejecución, debería ver un mensaje que indica que se completó sin ninguna tarea fallida.
Antes de ejecutar un flujo de trabajo, Omnition requiere que se ejecuten los siguientes archivos:
Archivos genoma FASTA y GTF de ENSEMBL.
Las secuencias de referencia del genoma deben formatearse como archivos FASTA.
Las anotaciones deben tener el formato de archivos GTF.
Los nombres de secuencia en los archivos FASTA y GTF deben coincidir.
Directorio con entradas FASTQ
NOTA: Los archivos de referencia de entrada se pueden comprimir como archivos gzip (.gz)
Omnition es compatible con las referencias de ENSEMBL. Las referencias ENSEMBL Human/GRCh38 y Mouse/GRCm39 son compatibles con Omnition. Otras especies de ENSEMBL no son compatibles y las referencias producidas por otras fuentes (NCBI, GENCODE, etc.) no son compatibles.
Las referencias humanas y de ratón se pueden obtener con los siguientes comandos.
mkdir ~/references/human cd ~/references/human
NOTA: Las rutas de archivos especificadas son a modo de ejemplo.
curl -o Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz curl -o Homo_sapiens.GRCh38.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/homo_sapiens/Homo_sapiens.GRCh38.106.gtf.gz
mkdir ~/references/mouse cd ~/references/mouse
curl -o Mus_musculus.GRCm39.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/mus_musculus/dna/Mus_musculus.GRCm39.dna.primary_assembly.fa.gz curl -o Mus_musculus.GRCm39.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/mus_musculus/Mus_musculus.GRCm39.106.gtf.gz
La canalización requiere un archivo con formato YAML con rutas de entrada/salida y parámetros específicos del ensayo cuando no se ejecutan los datos de la prueba. Puede encontrar una descripción detallada del contenido del archivo, los parámetros disponibles y cómo formatearlos en el manual del usuario. Se pueden encontrar ejemplos de configuraciones YAML en la carpeta example-yamls de este repositorio.
Con Singularidad:
nextflow run BioRadOpenSource/omnition -params-file
Con Docker:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
Con Singularidad:
nextflow run BioRadOpenSource/omnition -params-file
Con Docker:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
Una vez completado, los informes se pueden encontrar en el subdirectorio results/report/
y los archivos intermedios se pueden encontrar en el subdirectorio results/Sample_Files/
. Además, se creará un directorio de caché de Nextflow ( .nextflow/
) y un directorio de trabajo ( work/
) en el directorio desde donde se ejecutó Nextflow. Esto permite que los análisis interrumpidos/fallidos se reanuden desde su punto de error. Si desea continuar una ejecución, agregue -resume
a los comandos de ejecución a continuación. Puede eliminar el caché y los directorios de trabajo para ahorrar espacio una vez finalizado, aunque esto inhibirá la función -resume
.
Volver arriba