Omnition は、Bio-Rad の ddSEQ™ Single-Cell 3' RNA-Seq Kit または ddSEQ™ SureCell ATAC-Seq Library Prep Kit および dsciATAC プロトコルで生成されたデータを処理するように設計されたパイプラインです。デバーコーディング、位置合わせ、ビードのマージ、セルの呼び出し、およびフィーチャのカウントを実行します。出力は、HTML レポートと下流の生物学的分析用のファイルです。
このページはクイックスタートを目的としています。 Omnition の完全なユーザー ガイドについては、以下を参照してください。
Omnition 単一細胞 3' RNA-Seq
Omnition シングルセル ATAC-Seq
オムニションの紹介
インストール
システム要件
ハードウェア要件
ソフトウェア要件
オムニションをダウンロード
インストールの確認
はじめる
YAML 構成
ATAC パイプラインを実行する
RNA パイプラインを実行する
ヒトゲノム
マウスゲノム
参考文献
ランニングオムニション
出力
Omnition Analysis Software は Nextflow フレームワークを利用して個々のプロセスを接続し、Docker または Singularity コンテナ プログラムを使用してコンテナと呼ばれる仮想環境でプロセスを実行します。最小要件を満たすシステムに Omnition がインストールされると、Nextflow と GitHub および Docker の統合により、追加の構成を行わずにワークフローが準備されます。
Omnition は、ローカル Linux サーバー、ハイ パフォーマンス コンピューティング (HPC) クラスター、またはクラウド仮想マシン上で実行されるように設計されており、64 ビット CentOS 7 および 8、Amazon Linux 2、および Ubuntu 18.04.6、20.04 LTS でテストされています。 、21.04、および 21.10 Linux オペレーティング システム。
注: これらは機能する可能性がありますが、Bio-Rad は追加の Linux バリアントや指定されたオペレーティング システムの他のバージョンをサポートしません。
インターネット接続
注: インターネットに直接アクセスせずにインストールする場合は、ユーザーマニュアルを参照してください。
要件 | ATACシーケンス解析 | コンビナトリアル ATAC seq 解析 | RNA配列解析 | 12 倍以上のサンプルに推奨 |
---|---|---|---|---|
CPU | 16 | 16 | 16 | 64 |
ラム | 64GB | 128GB | 64GB | 512GB |
IOPS* | 3,000 | 3,000 | 3,000 | 16,000 |
I/Oスループット* | 125Mbps | 125Mbps | 125Mbps | 1,000Mbps |
EBSボリュームタイプ* | GP3 | GP3 | GP3 | GP3 |
*AWS 固有のクラウド コンピューティング仕様
Nextflow (v22.04.0 ~ v23.10.1) または Conda を使用した Nextflow
注:次のコマンドを使用して、Conda インストールで Nextflow バージョンを指定します:
conda install –c bioconda nextflow=
次のコンテナ プログラムのうち 1 つだけが必要です: Docker (>=20.10.7) または Singularity (>=3.6.4)
注: Docker を使用している場合は、パイプラインを実行する前に
USER
docker root ユーザー グループに追加する必要があります。 HPC クラスターなどの共有システムでは、セキュリティ リスクによりこれが不可能な場合があるため、代わりに Singularity プロファイル (デフォルト) を使用してパイプラインを実行する必要があります。ユーザーは、Omnition を使用する前に、Docker または Singularity が利用可能であることをシステム管理者に確認する必要があります。
Omnition をダウンロードして実行するには、nextflow を使用して GitHub から最新の Omnition バージョンを取得します。
nextflow pull BioRadOpenSource/omnition
Omnition には、環境が適切に構築され、すべてのソフトウェアの依存関係が適切に配置されていることを検証するための小規模なデモンストレーション データセットが含まれています。各分析タイプのインストールが成功したかどうかを確認するには、コンピューターにインストールされているコンテナー システム (Singularity または Docker) に対して Nextflow コマンドを実行します。
各分析ワークフローが正しくインストールされていることを確認するには、Docker または Singularity で次のコマンドを実行します。
注:作業ファイル (および特に指定されていない限り、出力ファイル) は、コマンド ラインでパイプラインが実行されたのと同じディレクトリに生成されます。
mkdir /home/ubuntu/demo_data cd /home/ubuntu/demo_data
注:指定したファイル パスは例です。
ドッカー:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,docker --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,docker --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,docker --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,docker --catac.output /home/ubuntu/demo_data/catac
特異点:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,standard --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,standard --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,standard --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,standard --catac.output /home/ubuntu/demo_data/catac
注:実行コマンドでの
-
と--
の使用に注意してください。先頭に 1 つの-
が付いている引数は Nextflow 引数で、--
が付いている引数はユーザー定義のパラメーターです。 Nextflow -r フラグを使用して、git タグ (リリースなど)、ブランチ、またはハッシュを指定して、git 履歴のその時点でパイプラインを実行することもできます。
注: nextflow 実行を起動すると、ランダムに生成された [adjective_names] がターミナルに表示されます。これらの名前は Nextflow によって作成されたリストからのものです。これは Nextflow に固有の機能であり、Bio-Rad が追加したものではありません。
実行が終了すると、失敗したタスクがなく完了したことを示すメッセージが表示されます。
ワークフローを実行する前に、Omnition では次のファイルを実行する必要があります。
ENSEMBL からのゲノム FASTA および GTF ファイル。
ゲノム参照配列は FASTA ファイルとしてフォーマットする必要があります。
注釈は GTF ファイルとしてフォーマットする必要があります。
FASTA ファイルと GTF ファイルのシーケンス名は一致する必要があります。
入力 FASTQ が含まれるディレクトリ
注:入力参照ファイルは gzip (.gz) ファイルとして圧縮できます。
Omnition は、ENSEMBL からの参照と互換性があります。 ENSEMBL Human/GRCh38 および Mouse/GRCm39 リファレンスは、Omnition によってサポートされています。 ENSEMBL の他の種はサポートされておらず、他のソース (NCBI、GENCODE など) によって作成された参照には互換性がありません。
ヒトおよびマウスの参照は、次のコマンドを使用して取得できます。
mkdir ~/references/human cd ~/references/human
注:指定したファイル パスは例です。
curl -o Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz curl -o Homo_sapiens.GRCh38.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/homo_sapiens/Homo_sapiens.GRCh38.106.gtf.gz
mkdir ~/references/mouse cd ~/references/mouse
curl -o Mus_musculus.GRCm39.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/mus_musculus/dna/Mus_musculus.GRCm39.dna.primary_assembly.fa.gz curl -o Mus_musculus.GRCm39.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/mus_musculus/Mus_musculus.GRCm39.106.gtf.gz
パイプラインでは、テスト データを実行しない場合、入出力パスとアッセイ固有のパラメーターを含む YAML 形式のファイルが必要です。ファイルの内容、使用可能なパラメータ、およびそれらのフォーマット方法の詳細な説明は、ユーザーマニュアルに記載されています。 YAML 構成の例は、このリポジトリの example-yamls フォルダーにあります。
特異点の場合:
nextflow run BioRadOpenSource/omnition -params-file
Docker を使用する場合:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
特異点の場合:
nextflow run BioRadOpenSource/omnition -params-file
Docker を使用する場合:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
完了後、レポートはresults/report/
サブディレクトリにあり、中間ファイルはresults/Sample_Files/
サブディレクトリにあります。さらに、Nextflow キャッシュ ディレクトリ ( .nextflow/
) と作業ディレクトリ ( work/
) が Nextflow が実行されたディレクトリに作成されます。これにより、中断または失敗した分析を失敗した時点から再開できます。実行を継続したい場合は、以下の実行コマンドに-resume
を追加します。完了後にキャッシュと作業ディレクトリを削除して領域を節約できますが、これにより-resume
機能が無効になります。
トップに戻る