Omnition adalah pipeline yang dirancang untuk memproses data yang dihasilkan dengan Kit RNA-Seq ddSEQ™ Single-Cell 3' Bio-Rad atau Kit Persiapan Perpustakaan ddSEQ™ SureCell ATAC-Seq dan protokol dsciATAC. Ia melakukan debarcoding, penyelarasan, penggabungan manik, pemanggilan sel, dan penghitungan fitur. Outputnya adalah laporan HTML dan file untuk analisis biologis hilir.
Halaman ini dimaksudkan sebagai awal yang cepat. Untuk panduan pengguna Omnition selengkapnya, silakan lihat:
Omnition Sel Tunggal 3' RNA-Seq
Omnition ATAC-Seq sel tunggal
Pengantar Omnisi
Instalasi
Persyaratan sistem
Persyaratan perangkat keras
Persyaratan perangkat lunak
Unduh Omnition.dll
Verifikasi instalasi
Memulai
Konfigurasi YAML
Jalankan pipa ATAC
Jalankan pipa RNA
Genom manusia
Genom tikus
Referensi
Menjalankan Omnisi
Keluaran
Perangkat Lunak Analisis Omnition menggunakan kerangka Nextflow untuk menghubungkan proses individual, dan menjalankan proses di lingkungan virtual yang disebut kontainer menggunakan program kontainer Docker atau Singularity. Setelah Omnition diinstal pada sistem yang memenuhi persyaratan minimum, integrasi Nextflow dengan GitHub dan Docker akan menyiapkan alur kerja tanpa konfigurasi tambahan apa pun.
Omnition dirancang untuk berjalan di server Linux lokal, cluster komputasi kinerja tinggi (HPC), atau mesin virtual cloud, dan telah diuji pada CentOS 7 dan 8 64-bit, Amazon Linux 2, dan Ubuntu 18.04.6, 20.04 LTS , 21.04, dan 21.10 sistem operasi Linux.
CATATAN : Meskipun berfungsi, Bio-Rad tidak mendukung varian Linux tambahan atau versi lain dari sistem operasi yang ditentukan.
Koneksi internet
CATATAN : Untuk instalasi tanpa akses internet langsung, silakan lihat panduan pengguna.
Persyaratan | Analisis urutan ATAC | Analisis seq ATAC kombinatorial | Analisis urutan RNA | Direkomendasikan untuk >=12x sampel |
---|---|---|---|---|
CPU | 16 | 16 | 16 | 64 |
RAM | 64 GB | 128 GB | 64 GB | 512 GB |
IOPS* | 3.000 | 3.000 | 3.000 | 16.000 |
Keluaran I/O* | 125mbps | 125mbps | 125mbps | 1.000mbps |
Jenis volume EBS* | gp3 | gp3 | gp3 | gp3 |
*Spesifikasi komputasi awan khusus AWS
Nextflow (v22.04.0 hingga v23.10.1) atau Nextflow dengan Conda
CATATAN: Tentukan versi Nextflow dalam instalasi Conda dengan menggunakan perintah berikut:
conda install –c bioconda nextflow=
Hanya satu dari program kontainer berikut yang diperlukan: Docker (>=20.10.7) atau Singularity (>=3.6.4)
CATATAN: Jika menggunakan Docker,
USER
Anda harus ditambahkan ke grup pengguna root buruh pelabuhan sebelum menjalankan pipeline. Pada sistem bersama, seperti klaster HPC, hal ini mungkin tidak dapat dilakukan karena risiko keamanan dan pipeline harus dijalankan menggunakan profil Singularitas (default). Pengguna harus memverifikasi dengan administrator sistem mereka bahwa Docker atau Singularity tersedia sebelum menggunakan Omnition.
Untuk mengunduh dan menjalankan Omnition, gunakan nextflow untuk mengambil versi Omnition terbaru dari GitHub.
nextflow pull BioRadOpenSource/omnition
Omnition mencakup kumpulan data demonstrasi kecil untuk memverifikasi bahwa lingkungan telah dibangun dengan benar dan semua ketergantungan perangkat lunak sudah ada. Untuk memverifikasi keberhasilan instalasi untuk setiap jenis analisis, jalankan perintah Nextflow untuk sistem kontainer yang diinstal di komputer Anda (Singularity atau Docker).
Untuk memverifikasi setiap alur kerja analisis diinstal dengan benar, jalankan perintah berikut dengan Docker atau Singularity.
CATATAN: File yang berfungsi (dan file output, kecuali ditentukan lain) akan dihasilkan di direktori yang sama tempat pipeline dijalankan pada baris perintah.
mkdir /home/ubuntu/demo_data cd /home/ubuntu/demo_data
CATATAN: Jalur file yang ditentukan adalah untuk tujuan contoh
Buruh pelabuhan:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,docker --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,docker --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,docker --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,docker --catac.output /home/ubuntu/demo_data/catac
Keganjilan:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,standard --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,standard --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,standard --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,standard --catac.output /home/ubuntu/demo_data/catac
CATATAN: Harap perhatikan penggunaan
-
dan--
dalam perintah eksekusi. Argumen dengan satu-
di depan adalah argumen Nextflow dan argumen dengan--
adalah parameter yang ditentukan pengguna. Anda juga dapat menggunakan flag Nextflow -r untuk menentukan tag git (yaitu rilis), cabang, atau hash untuk mengeksekusi pipeline pada titik tersebut dalam riwayat git.
CATATAN: Saat meluncurkan proses nextflow akan ada [nama_kata sifat] yang dihasilkan secara acak yang muncul di terminal. Nama-nama ini berasal dari daftar yang disiapkan oleh Nextflow. Ini adalah fitur yang melekat pada nextflow, bukan sesuatu yang ditambahkan oleh Bio-Rad.
Ketika proses selesai, Anda akan melihat pesan bahwa proses telah selesai tanpa ada tugas yang gagal.
Sebelum menjalankan alur kerja, Omnition memerlukan file berikut untuk dijalankan:
File Genome FASTA dan GTF dari ENSEMBL.
Urutan referensi genom harus diformat sebagai file FASTA.
Anotasi harus diformat sebagai file GTF.
Nama urutan di file FASTA dan GTF harus cocok.
Direktori dengan input FASTQ
CATATAN: File referensi masukan dapat dikompresi sebagai file gzip (.gz).
Omnition kompatibel dengan referensi dari ENSEMBL. Referensi ENSEMBL Human/GRCh38 dan Mouse/GRCm39 didukung oleh Omnition. Spesies lain dari ENSEMBL tidak didukung dan referensi yang dihasilkan oleh sumber lain (NCBI, GENCODE, dll.) tidak kompatibel.
Referensi manusia dan tikus dapat diperoleh dengan perintah berikut.
mkdir ~/references/human cd ~/references/human
CATATAN: Jalur file yang ditentukan adalah untuk tujuan contoh
curl -o Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz curl -o Homo_sapiens.GRCh38.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/homo_sapiens/Homo_sapiens.GRCh38.106.gtf.gz
mkdir ~/references/mouse cd ~/references/mouse
curl -o Mus_musculus.GRCm39.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/mus_musculus/dna/Mus_musculus.GRCm39.dna.primary_assembly.fa.gz curl -o Mus_musculus.GRCm39.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/mus_musculus/Mus_musculus.GRCm39.106.gtf.gz
Pipeline memerlukan file berformat YAML dengan jalur input/output dan parameter khusus pengujian saat tidak menjalankan data pengujian. Penjelasan rinci tentang isi file, parameter yang tersedia, dan cara memformatnya dapat ditemukan di panduan pengguna. Contoh konfigurasi YAML dapat ditemukan di folder example-yamls di repo ini.
Dengan Singularitas:
nextflow run BioRadOpenSource/omnition -params-file
Dengan Docker:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
Dengan Singularitas:
nextflow run BioRadOpenSource/omnition -params-file
Dengan Docker:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
Setelah selesai, laporan dapat ditemukan di subdirektori results/report/
dan file perantara dapat ditemukan di subdirektori results/Sample_Files/
. Selain itu, direktori cache Nextflow ( .nextflow/
) dan direktori kerja ( work/
) akan dibuat di direktori tempat Nextflow dieksekusi. Hal ini memungkinkan analisis yang terputus/gagal dilanjutkan dari titik kegagalannya. Jika Anda ingin melanjutkan proses, tambahkan -resume
ke perintah eksekusi di bawah. Anda dapat menghapus cache dan direktori kerja untuk menghemat ruang setelah selesai meskipun ini akan menghambat fitur -resume
.
Kembali ke atas