Omnition 是一個管道,旨在處理使用 Bio-Rad 的 ddSEQ™ 單細胞 3' RNA-Seq 試劑盒或 ddSEQ™ SureCell ATAC-Seq 文庫製備試劑盒和 dsciATAC 協議產生的數據。它執行去條碼、對齊、珠子合併、單元呼叫和特徵計數。輸出是 HTML 報告和用於下游生物分析的文件。
此頁面旨在作為快速入門。有關完整的 Omnition 使用者指南,請參閱:
Omnition 單細胞 3' RNA 定序
Omnition 單細胞 ATAC 定序
Omnition簡介
安裝
系統需求
硬體需求
軟體需求
下載全能
驗證安裝
入門
YAML 設定
運行 ATAC 管道
運行 RNA 管道
人類基因組
小鼠基因組
參考
跑步全能
輸出
Omnition Analysis Software 利用 Nextflow 框架連接各個進程,並使用 Docker 或 Singularity 容器程式在稱為容器的虛擬環境中執行進程。一旦 Omnition 安裝在滿足最低要求的系統上,Nextflow 與 GitHub 和 Docker 的整合將準備工作流程,無需任何額外配置。
Omnition 設計為在本地 Linux 伺服器、高效能運算 (HPC) 叢集或雲端虛擬機器上運行,並已在 64 位元 CentOS 7 和 8、Amazon Linux 2 以及 Ubuntu 18.04.6、20.04 LTS 上進行了測試、 21.04 和21.10 Linux 作業系統。
注意:雖然它們可能有效,但 Bio-Rad 不支援其他 Linux 變體或指定作業系統的其他版本。
網路連線
注意:對於無需直接存取互聯網的安裝,請參閱使用手冊。
要求 | ATAC 序列分析 | 組合 ATAC seq 分析 | RNA序列分析 | 建議用於 >=12x 樣本 |
---|---|---|---|---|
中央處理器 | 16 | 16 | 16 | 64 |
記憶體 | 64GB | 128GB | 64GB | 512GB |
IOPS* | 3,000 | 3,000 | 3,000 | 16,000 |
I/O 吞吐量* | 125 Mbps | 125 Mbps | 125 Mbps | 1,000 Mbps |
EBS 卷類型* | GP3 | GP3 | GP3 | GP3 |
*AWS特定雲端運算規範
Nextflow(v22.04.0 至 v23.10.1)或 Nextflow 與 Conda
注意:使用下列指令在 Conda 安裝中指定 Nextflow 版本:
conda install –c bioconda nextflow=
只需要以下容器程式之一:Docker (>=20.10.7) 或 Singularity (>=3.6.4)
注意:如果使用 Docker,則在執行管道之前必須將您的
USER
新增至 docker root 使用者群組。在共用系統(例如 HPC 叢集)上,由於安全風險,這可能無法實現,並且應使用 Singularity 設定檔(預設)來執行管道。在使用 Omnition 之前,使用者必須向系統管理員驗證 Docker 或 Singularity 是否可用。
若要下載並執行 Omnition,請使用 nextflow 從 GitHub 擷取最新的 Omnition 版本。
nextflow pull BioRadOpenSource/omnition
Omnition 包含小型演示資料集,用於驗證環境是否已正確建置以及所有軟體依賴項是否已就位。若要驗證每種分析類型的安裝是否成功,請為電腦上安裝的容器系統(Singularity 或 Docker)執行 Nextflow 命令。
若要驗證每個分析工作流程是否已正確安裝,請使用 Docker 或 Singularity 執行下列命令。
注意:工作文件(和輸出文件,除非另有指定)將在命令列上運行管道的同一目錄中產生。
mkdir /home/ubuntu/demo_data cd /home/ubuntu/demo_data
注意:指定的檔案路徑僅供範例之用
碼頭工人:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,docker --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,docker --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,docker --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,docker --catac.output /home/ubuntu/demo_data/catac
奇點:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,standard --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,standard --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,standard --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,standard --catac.output /home/ubuntu/demo_data/catac
注意:請注意執行命令中
-
和--
的使用。前面有單一-
參數是 Nextflow 參數,帶有--
的參數是使用者定義的參數。您也可以使用 Nextflow -r 標誌來指定 git 標籤(即版本)、分支或哈希,以在 git 歷史記錄中的該點執行管道。
注意:啟動 nextflow 運行時,終端中將出現一個隨機產生的 [adjective_names]。這些名稱來自 Nextflow 準備的清單。這是 nextflow 的固有功能,並非 Bio-Rad 添加的功能。
運行完成後,您應該會看到一條訊息,表示運行已完成,沒有任何失敗的任務。
在運行工作流程之前,Omnition 需要執行以下檔案:
來自 ENSEMBL 的基因組 FASTA 和 GTF 文件。
基因組參考序列必須格式化為 FASTA 檔。
註釋必須採用 GTF 檔案格式。
FASTA 和 GTF 檔案中的序列名稱必須相符。
包含輸入 FASTQ 的目錄
注意:輸入參考檔可以壓縮為 gzip (.gz) 檔案
Omnition 與 ENSEMBL 的參考文獻相容。 Omnition 支持 ENSEMBL Human/GRCh38 和 Mouse/GRCm39 參考。不支援 ENSEMBL 中的其他物種,且其他來源(NCBI、GENCODE 等)產生的參考也不相容。
可以使用以下命令來取得人類和小鼠參考。
mkdir ~/references/human cd ~/references/human
注意:指定的檔案路徑僅供範例之用
curl -o Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz curl -o Homo_sapiens.GRCh38.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/homo_sapiens/Homo_sapiens.GRCh38.106.gtf.gz
mkdir ~/references/mouse cd ~/references/mouse
curl -o Mus_musculus.GRCm39.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/mus_musculus/dna/Mus_musculus.GRCm39.dna.primary_assembly.fa.gz curl -o Mus_musculus.GRCm39.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/mus_musculus/Mus_musculus.GRCm39.106.gtf.gz
當不運行測試資料時,管道需要一個 YAML 格式的文件,其中包含輸入/輸出路徑和特定於測定的參數。文件內容、可用參數以及如何格式化它們的詳細說明可以在使用者手冊中找到。範例 YAML 配置可以在此儲存庫的 example-yamls 資料夾下找到。
具有奇異性:
nextflow run BioRadOpenSource/omnition -params-file
使用 Docker:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
具有奇異性:
nextflow run BioRadOpenSource/omnition -params-file
使用 Docker:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
完成後,可以在results/report/
子目錄中找到報告,可以在results/Sample_Files/
子目錄中找到中間文件。此外,將在執行 Nextflow 的目錄中建立 Nextflow 快取目錄 ( .nextflow/
) 和工作目錄 ( work/
)。這允許中斷/失敗的分析從故障點恢復。如果您想繼續運行,請將-resume
加入到下面的執行命令中。您可以在完成後刪除快取和工作目錄以節省空間,但這會抑制-resume
功能。
回到頂部