Omnition은 Bio-Rad의 ddSEQ™ Single-Cell 3' RNA-Seq 키트 또는 ddSEQ™ SureCell ATAC-Seq 라이브러리 준비 키트 및 dsciATAC 프로토콜을 사용하여 생성된 데이터를 처리하도록 설계된 파이프라인입니다. 바코드 제거, 정렬, 비드 병합, 셀 호출 및 기능 계산을 수행합니다. 출력은 다운스트림 생물학적 분석을 위한 HTML 보고서 및 파일입니다.
이 페이지는 빠른 시작을 위한 것입니다. 전체 Omnition 사용자 가이드를 보려면 다음을 참조하세요.
Omnition 단일 세포 3' RNA-Seq
Omnition 단일 셀 ATAC-Seq
옴니션 소개
설치
시스템 요구사항
하드웨어 요구 사항
소프트웨어 요구사항
옴니션 다운로드
설치 확인
시작하기
YAML 구성
ATAC 파이프라인 실행
RNA 파이프라인 실행
인간 게놈
마우스 게놈
참고자료
러닝 옴니션
출력
Omnition Analysis Software는 Nextflow 프레임워크를 활용하여 개별 프로세스를 연결하고 Docker 또는 Singularity 컨테이너 프로그램을 사용하여 컨테이너라는 가상 환경에서 프로세스를 실행합니다. 최소 요구 사항을 충족하는 시스템에 Omnition을 설치하면 GitHub 및 Docker와의 Nextflow 통합으로 추가 구성 없이 워크플로가 준비됩니다.
Omnition은 로컬 Linux 서버, HPC(고성능 컴퓨팅) 클러스터 또는 클라우드 가상 머신에서 실행되도록 설계되었으며 64비트 CentOS 7 및 8, Amazon Linux 2, Ubuntu 18.04.6, 20.04 LTS에서 테스트되었습니다. , 21.04 및 21.10 Linux 운영 체제.
참고 : Bio-Rad는 작동할 수 있지만 추가 Linux 변형이나 지정된 운영 체제의 다른 버전을 지원하지 않습니다.
인터넷 연결
참고 : 인터넷에 직접 연결하지 않고 설치하려면 사용 설명서를 참조하세요.
요구 사항 | ATAC 서열 분석 | 조합 ATAC 서열 분석 | RNA 서열 분석 | 12x 이상의 샘플에 권장됨 |
---|---|---|---|---|
CPU | 16 | 16 | 16 | 64 |
숫양 | 64GB | 128GB | 64GB | 512GB |
IOPS* | 3,000 | 3,000 | 3,000 | 16,000 |
I/O 처리량* | 125Mbps | 125Mbps | 125Mbps | 1,000Mbps |
EBS 볼륨 유형* | GP3 | GP3 | GP3 | GP3 |
*AWS 특정 클라우드 컴퓨팅 사양
Nextflow(v22.04.0~v23.10.1) 또는 Conda가 포함된 Nextflow
참고: 다음 명령을 사용하여 Conda 설치에서 Nextflow 버전을 지정합니다.
conda install –c bioconda nextflow=
Docker(>=20.10.7) 또는 Singularity(>=3.6.4) 컨테이너 프로그램 중 하나만 필요합니다.
참고: Docker를 사용하는 경우 파이프라인을 실행하기 전에
USER
docker 루트 사용자 그룹에 추가해야 합니다. HPC 클러스터와 같은 공유 시스템에서는 보안 위험으로 인해 이것이 불가능할 수 있으며 대신 Singularity 프로필(기본값)을 사용하여 파이프라인을 실행해야 합니다. 사용자는 Omnition을 사용하기 전에 Docker 또는 Singularity를 사용할 수 있는지 시스템 관리자에게 확인해야 합니다.
Omnition을 다운로드하고 실행하려면 nextflow를 사용하여 GitHub에서 최신 Omnition 버전을 검색하세요.
nextflow pull BioRadOpenSource/omnition
Omnition에는 환경이 제대로 구축되었는지, 모든 소프트웨어 종속성이 있는지 확인하기 위한 소규모 데모 데이터 세트가 포함되어 있습니다. 각 분석 유형에 대한 설치 성공을 확인하려면 컴퓨터(Singularity 또는 Docker)에 설치된 컨테이너 시스템에 대해 Nextflow 명령을 실행하십시오.
각 분석 워크플로우가 올바르게 설치되었는지 확인하려면 Docker 또는 Singularity를 사용하여 다음 명령을 실행하십시오.
참고: 작업 파일(및 달리 지정하지 않는 한 출력 파일)은 명령줄에서 파이프라인이 실행된 것과 동일한 디렉터리에 생성됩니다.
mkdir /home/ubuntu/demo_data cd /home/ubuntu/demo_data
참고: 지정된 파일 경로는 예시용입니다.
도커:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,docker --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,docker --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,docker --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,docker --catac.output /home/ubuntu/demo_data/catac
특이:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,standard --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,standard --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,standard --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,standard --catac.output /home/ubuntu/demo_data/catac
참고: 실행 명령에서
-
및--
의 사용에 유의하십시오. 앞에-
가 하나 있는 인수는 Nextflow 인수이고--
가 있는 인수는 사용자 정의 매개변수입니다. 또한 Nextflow -r 플래그를 사용하여 git 기록의 해당 지점에서 파이프라인을 실행하기 위한 git 태그(예: 릴리스), 분기 또는 해시를 지정할 수 있습니다.
참고: nextflow 실행을 시작하면 터미널에 무작위로 생성된 [형용사 이름]이 나타납니다. 이 이름은 Nextflow에서 준비한 목록에서 나온 것입니다. 이는 Bio-Rad가 추가한 기능이 아닌 nextflow 고유의 기능입니다.
실행이 완료되면 실패한 작업 없이 완료되었다는 메시지가 표시됩니다.
워크플로를 실행하기 전에 Omnition을 실행하려면 다음 파일이 필요합니다.
ENSEMBL의 게놈 FASTA 및 GTF 파일.
게놈 참조 서열은 FASTA 파일 형식이어야 합니다.
주석은 GTF 파일 형식이어야 합니다.
FASTA 및 GTF 파일의 시퀀스 이름이 일치해야 합니다.
입력 FASTQ가 있는 디렉터리
참고: 입력 참조 파일은 gzip(.gz) 파일로 압축될 수 있습니다.
Omnition은 ENSEMBL의 참조 자료와 호환됩니다. ENSEMBL Human/GRCh38 및 Mouse/GRCm39 참조는 Omnition에서 지원됩니다. ENSEMBL의 다른 종은 지원되지 않으며 다른 소스(NCBI, GENCODE 등)에서 생성된 참조는 호환되지 않습니다.
인간 및 마우스 참조는 다음 명령을 사용하여 얻을 수 있습니다.
mkdir ~/references/human cd ~/references/human
참고: 지정된 파일 경로는 예시용입니다.
curl -o Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz curl -o Homo_sapiens.GRCh38.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/homo_sapiens/Homo_sapiens.GRCh38.106.gtf.gz
mkdir ~/references/mouse cd ~/references/mouse
curl -o Mus_musculus.GRCm39.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/mus_musculus/dna/Mus_musculus.GRCm39.dna.primary_assembly.fa.gz curl -o Mus_musculus.GRCm39.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/mus_musculus/Mus_musculus.GRCm39.106.gtf.gz
파이프라인에는 테스트 데이터를 실행하지 않을 때 입력/출력 경로 및 분석별 매개변수가 포함된 YAML 형식의 파일이 필요합니다. 파일 내용, 사용 가능한 매개변수 및 형식 지정 방법에 대한 자세한 설명은 사용자 설명서에서 확인할 수 있습니다. 예제 YAML 구성은 이 저장소의 example-yamls 폴더에서 찾을 수 있습니다.
특이점:
nextflow run BioRadOpenSource/omnition -params-file
도커를 사용하면:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
특이점:
nextflow run BioRadOpenSource/omnition -params-file
도커를 사용하면:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
완료 후 보고서는 results/report/
하위 디렉터리에서 찾을 수 있으며 중간 파일은 results/Sample_Files/
하위 디렉터리에서 찾을 수 있습니다. 또한 Nextflow가 실행된 디렉터리에 Nextflow 캐시 디렉터리( .nextflow/
)와 작업 디렉터리( work/
)가 생성됩니다. 이를 통해 중단되거나 실패한 분석을 실패 지점부터 재개할 수 있습니다. 계속해서 실행하고 싶다면 아래 실행 명령어에 -resume
추가하세요. 완료 후 공간을 절약하기 위해 캐시 및 작업 디렉터리를 삭제할 수 있지만 이렇게 하면 -resume
기능이 금지됩니다.
맨 위로 돌아가기