Omnition เป็นไปป์ไลน์ที่ออกแบบมาเพื่อประมวลผลข้อมูลที่สร้างด้วย ddSEQ™ Single-Cell 3' RNA-Seq Kit ของ Bio-Rad หรือ ddSEQ™ SureCell ATAC-Seq Library Prep Kit และโปรโตคอล dsciATAC โดยทำการถอดรหัสบาร์โค้ด การจัดตำแหน่ง การรวมบีด การเรียกเซลล์ และการนับคุณสมบัติ เอาต์พุตเป็นรายงาน HTML และไฟล์สำหรับการวิเคราะห์ทางชีววิทยาขั้นปลาย
หน้านี้มีวัตถุประสงค์เพื่อเป็นการเริ่มต้นอย่างรวดเร็ว สำหรับคู่มือผู้ใช้ Omnition ฉบับสมบูรณ์ โปรดดูที่:
Omnition เซลล์เดียว 3' RNA-Seq
Omnition เซลล์เดียว ATAC-Seq
ความรู้เบื้องต้นเกี่ยวกับ Omnition
การติดตั้ง
ความต้องการของระบบ
ข้อกำหนดด้านฮาร์ดแวร์
ข้อกำหนดซอฟต์แวร์
ดาวน์โหลด Omnition
ตรวจสอบการติดตั้ง
เริ่มต้นใช้งาน
การกำหนดค่า YAML
เรียกใช้ไปป์ไลน์ ATAC
เรียกใช้ไปป์ไลน์ RNA
จีโนมมนุษย์
จีโนมของเมาส์
อ้างอิง
วิ่ง Omnition
เอาท์พุต
ซอฟต์แวร์การวิเคราะห์ Omnition ใช้เฟรมเวิร์ก Nextflow เพื่อเชื่อมต่อแต่ละกระบวนการ และรันกระบวนการในสภาพแวดล้อมเสมือนที่เรียกว่าคอนเทนเนอร์โดยใช้โปรแกรมคอนเทนเนอร์ Docker หรือ Singularity เมื่อติดตั้ง Omnition บนระบบที่ตรงตามข้อกำหนดขั้นต่ำแล้ว การผสานรวม Nextflow กับ GitHub และ Docker จะเตรียมเวิร์กโฟลว์โดยไม่ต้องกำหนดค่าเพิ่มเติมใดๆ
Omnition ได้รับการออกแบบมาเพื่อทำงานบนเซิร์ฟเวอร์ Linux ภายใน คลัสเตอร์การประมวลผลประสิทธิภาพสูง (HPC) หรือเครื่องเสมือนบนคลาวด์ และได้รับการทดสอบบน CentOS 7 และ 8 แบบ 64 บิต, Amazon Linux 2 และ Ubuntu 18.04.6, 20.04 LTS ระบบปฏิบัติการ Linux , 21.04 และ 21.10
หมายเหตุ : แม้ว่ามันอาจจะทำงานได้ แต่ Bio-Rad ไม่รองรับ Linux รุ่นเพิ่มเติมหรือเวอร์ชันอื่นของระบบปฏิบัติการที่ระบุ
การเชื่อมต่ออินเทอร์เน็ต
หมายเหตุ : สำหรับการติดตั้งโดยไม่ต้องเชื่อมต่ออินเทอร์เน็ตโดยตรง โปรดดูคู่มือผู้ใช้
ความต้องการ | การวิเคราะห์ลำดับ ATAC | การวิเคราะห์ลำดับ ATAC แบบผสมผสาน | การวิเคราะห์ลำดับ RNA | แนะนำสำหรับตัวอย่าง >=12x |
---|---|---|---|---|
ซีพียู | 16 | 16 | 16 | 64 |
แรม | 64GB | 128GB | 64GB | 512GB |
ไอโอพีเอส* | 3,000 | 3,000 | 3,000 | 16,000 |
ปริมาณงาน I/O* | 125 เมกะบิตต่อวินาที | 125 เมกะบิตต่อวินาที | 125 เมกะบิตต่อวินาที | 1,000 เมกะบิตต่อวินาที |
ประเภทปริมาณ EBS* | จีพี3 | จีพี3 | จีพี3 | จีพี3 |
*ข้อกำหนดเฉพาะของการประมวลผลบนคลาวด์ของ AWS
Nextflow (v22.04.0 ถึง v23.10.1) หรือ Nextflow พร้อม Conda
หมายเหตุ: ระบุเวอร์ชัน Nextflow ในการติดตั้ง Conda โดยใช้คำสั่งต่อไปนี้:
conda install –c bioconda nextflow=
ต้องการเพียงหนึ่งในโปรแกรมคอนเทนเนอร์ต่อไปนี้เท่านั้น: Docker (>=20.10.7) หรือ Singularity (>=3.6.4)
หมายเหตุ: หากใช้ Docker จะต้องเพิ่ม
USER
ของคุณไปยังกลุ่มผู้ใช้รูทนักเทียบท่าก่อนที่จะดำเนินการไปป์ไลน์ บนระบบที่ใช้ร่วมกัน เช่น คลัสเตอร์ HPC สิ่งนี้อาจไม่สามารถทำได้เนื่องจากความเสี่ยงด้านความปลอดภัย และไปป์ไลน์ควรดำเนินการโดยใช้โปรไฟล์เอกฐาน (ค่าเริ่มต้น) แทน ผู้ใช้จะต้องตรวจสอบกับผู้ดูแลระบบว่า Docker หรือ Singularity พร้อมใช้งานก่อนที่จะใช้ Omnition
หากต้องการดาวน์โหลดและเรียกใช้ Omnition ให้ใช้ nextflow เพื่อดึงข้อมูล Omnition เวอร์ชันล่าสุดจาก GitHub
nextflow pull BioRadOpenSource/omnition
Omnition ประกอบด้วยชุดข้อมูลสาธิตขนาดเล็กเพื่อตรวจสอบว่าสภาพแวดล้อมถูกสร้างขึ้นอย่างเหมาะสมและมีการพึ่งพาซอฟต์แวร์ทั้งหมด หากต้องการตรวจสอบความสำเร็จของการติดตั้งสำหรับการวิเคราะห์แต่ละประเภท ให้รันคำสั่ง Nextflow สำหรับระบบคอนเทนเนอร์ที่ติดตั้งบนคอมพิวเตอร์ของคุณ (Singularity หรือ Docker)
หากต้องการตรวจสอบว่ามีการติดตั้งเวิร์กโฟลว์การวิเคราะห์แต่ละรายการอย่างถูกต้อง ให้รันคำสั่งต่อไปนี้ด้วย Docker หรือ Singularity
หมายเหตุ: ไฟล์การทำงาน (และไฟล์เอาต์พุต เว้นแต่จะระบุไว้เป็นอย่างอื่น) จะถูกสร้างขึ้นในไดเร็กทอรีเดียวกันกับที่ไปป์ไลน์ถูกเรียกใช้บนบรรทัดคำสั่ง
mkdir /home/ubuntu/demo_data cd /home/ubuntu/demo_data
หมายเหตุ: เส้นทางไฟล์ที่ระบุมีไว้เพื่อเป็นตัวอย่างเท่านั้น
นักเทียบท่า:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,docker --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,docker --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,docker --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,docker --catac.output /home/ubuntu/demo_data/catac
ภาวะเอกฐาน:
# Verify single and mixed species 3’ RNA workflows nextflow run BioRadOpenSource/omnition -profile demo_rna_single,standard --rna.output /home/ubuntu/demo_data/rna nextflow run BioRadOpenSource/omnition -profile demo_rna_mixed_options,standard --rna.output /home/ubuntu/demo_data/rna_mixed # Verify ATAC-seq and combinatorial ATAC-seq workflows nextflow run BioRadOpenSource/omnition -profile demo_atac,standard --atac.output /home/ubuntu/demo_data/atac nextflow run BioRadOpenSource/omnition -profile demo_catac,standard --catac.output /home/ubuntu/demo_data/catac
หมายเหตุ: โปรดสังเกตการใช้
-
และ--
ในคำสั่งดำเนินการ อาร์กิวเมนต์ที่มีเครื่องหมายเดียว-
ข้างหน้าคืออาร์กิวเมนต์ Nextflow และอาร์กิวเมนต์ที่มี--
เป็นพารามิเตอร์ที่ผู้ใช้กำหนด คุณยังอาจใช้แฟล็ก Nextflow -r เพื่อระบุแท็ก git (เช่น release) สาขา หรือแฮชเพื่อดำเนินการไปป์ไลน์ที่จุดนั้นในประวัติ git
หมายเหตุ: เมื่อเปิดตัวการเรียกใช้ nextflow จะมี [adjective_names] ที่สร้างขึ้นแบบสุ่มซึ่งปรากฏในเทอร์มินัล ชื่อเหล่านี้มาจากรายการที่ Nextflow เตรียมไว้ นี่เป็นคุณลักษณะที่มีอยู่ใน Nextflow ไม่ใช่สิ่งที่ Bio-Rad เพิ่มเข้ามา
เมื่อการรันเสร็จสิ้น คุณจะเห็นข้อความว่าการรันเสร็จสิ้นแล้วโดยไม่มีงานที่ล้มเหลว
ก่อนที่จะรันเวิร์กโฟลว์ Omnition ต้องการไฟล์ต่อไปนี้เพื่อรัน:
ไฟล์จีโนม FASTA และ GTF จาก ENSEMBL
ลำดับการอ้างอิงจีโนมต้องอยู่ในรูปแบบไฟล์ FASTA
คำอธิบายประกอบต้องอยู่ในรูปแบบไฟล์ GTF
ชื่อลำดับในไฟล์ FASTA และ GTF ต้องตรงกัน
ไดเร็กทอรีที่มีอินพุต FASTQ
หมายเหตุ: ไฟล์อ้างอิงอินพุตสามารถบีบอัดเป็นไฟล์ gzip (.gz) ได้
Omnition เข้ากันได้กับข้อมูลอ้างอิงจาก ENSEMBL การอ้างอิง ENSEMBL Human/GRCh38 และ Mouse/GRCm39 ได้รับการสนับสนุนโดย Omnition ไม่รองรับสายพันธุ์อื่นจาก ENSEMBL และการอ้างอิงที่ผลิตโดยแหล่งอื่น (NCBI, GENCODE ฯลฯ) ไม่สามารถเข้ากันได้
สามารถรับการอ้างอิงของมนุษย์และเมาส์ได้ด้วยคำสั่งต่อไปนี้
mkdir ~/references/human cd ~/references/human
หมายเหตุ: เส้นทางไฟล์ที่ระบุมีไว้เพื่อเป็นตัวอย่างเท่านั้น
curl -o Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz curl -o Homo_sapiens.GRCh38.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/homo_sapiens/Homo_sapiens.GRCh38.106.gtf.gz
mkdir ~/references/mouse cd ~/references/mouse
curl -o Mus_musculus.GRCm39.dna.primary_assembly.fa.gz http://ftp.ensembl.org/pub/release-106/fasta/mus_musculus/dna/Mus_musculus.GRCm39.dna.primary_assembly.fa.gz curl -o Mus_musculus.GRCm39.106.gtf.gz http://ftp.ensembl.org/pub/release-106/gtf/mus_musculus/Mus_musculus.GRCm39.106.gtf.gz
ไปป์ไลน์ต้องการไฟล์ที่จัดรูปแบบ YAML พร้อมด้วยเส้นทางอินพุต/เอาต์พุตและพารามิเตอร์เฉพาะการทดสอบ เมื่อไม่ได้รันข้อมูลทดสอบ คำอธิบายโดยละเอียดเกี่ยวกับเนื้อหาไฟล์ พารามิเตอร์ที่ใช้ได้ และวิธีการจัดรูปแบบสามารถดูได้ในคู่มือผู้ใช้ ตัวอย่างการกำหนดค่า YAML สามารถพบได้ในโฟลเดอร์ example-yamls ของ repo นี้
ด้วยเอกภาวะ:
nextflow run BioRadOpenSource/omnition -params-file
ด้วยนักเทียบท่า:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
ด้วยเอกภาวะ:
nextflow run BioRadOpenSource/omnition -params-file
ด้วยนักเทียบท่า:
nextflow run BioRadOpenSource/omnition -params-file-profile docker
หลังจากเสร็จสิ้น คุณสามารถดูรายงานได้ในไดเร็กทอรี results/report/
และไฟล์ระดับกลางสามารถพบได้ในไดเร็กทอรี results/Sample_Files/
นอกจากนี้ ไดเร็กทอรีแคช Nextflow ( .nextflow/
) และไดเร็กทอรีการทำงาน ( work/
) จะถูกสร้างขึ้นในไดเร็กทอรีที่เรียกใช้ Nextflow ซึ่งช่วยให้การวิเคราะห์ที่ถูกขัดจังหวะ/ล้มเหลวกลับมาทำงานต่อจากจุดที่ล้มเหลวได้ หากคุณต้องการดำเนินการรันต่อ ให้เพิ่ม -resume
ในคำสั่งดำเนินการด้านล่างนี้ คุณสามารถลบแคชและไดเร็กทอรีการทำงานเพื่อประหยัดพื้นที่หลังจากเสร็จสิ้น แม้ว่าการดำเนินการนี้จะขัดขวางคุณสมบัติ -resume
ก็ตาม
กลับไปด้านบน