nf-core/cageseq เป็นไปป์ไลน์การวิเคราะห์ชีวสารสนเทศที่ใช้สำหรับข้อมูลลำดับ CAGE-seq
ไปป์ไลน์ใช้ไฟล์ fastq แบบ demultiplexed แบบดิบเป็นอินพุตและรวมถึงขั้นตอนสำหรับการตัดตัวเชื่อมโยงและสิ่งประดิษฐ์ (cutadapt), การลบ rRNA (SortMeRNA, การจัดตำแหน่งไปยังจีโนมอ้างอิง (STAR หรือ bowtie1) และการนับและการจัดกลุ่มแท็ก CAGE (paraclu) นอกจากนี้ ยังมีอีกหลาย มีขั้นตอนการควบคุมคุณภาพ (FastQC, RSeQC, MultiQC) เพื่อช่วยให้ตรวจสอบผลลัพธ์ได้ง่ายหลังการทำงาน
ไปป์ไลน์ถูกสร้างขึ้นโดยใช้ Nextflow ซึ่งเป็นเครื่องมือเวิร์กโฟลว์เพื่อรันงานบนโครงสร้างพื้นฐานการประมวลผลหลายรายการในลักษณะพกพาสะดวก มันมาพร้อมกับคอนเทนเนอร์นักเทียบท่าที่ทำให้การติดตั้งเล็กน้อยและให้ผลลัพธ์ที่ทำซ้ำได้สูง
ติดตั้ง nextflow
ติดตั้ง Docker
, Singularity
หรือ Podman
ใด ๆ เพื่อการทำซ้ำไปป์ไลน์แบบเต็ม (โปรดใช้ Conda
เป็นทางเลือกสุดท้ายเท่านั้น ดูเอกสาร)
ดาวน์โหลดไปป์ไลน์และทดสอบบนชุดข้อมูลขั้นต่ำด้วยคำสั่งเดียว:
nextflow run nf-core/cageseq -profile test, < docker/singularity/podman/conda/institute >
โปรดตรวจสอบ nf-core/configs เพื่อดูว่ามีไฟล์กำหนดค่าแบบกำหนดเองเพื่อเรียกใช้ไปป์ไลน์ nf-core สำหรับสถาบันของคุณอยู่แล้วหรือไม่ หากเป็นเช่นนั้น คุณสามารถใช้
-profile
ในคำสั่งของคุณได้ ซึ่งจะเปิดใช้งานdocker
หรือsingularity
และตั้งค่าการดำเนินการที่เหมาะสมสำหรับสภาพแวดล้อมการประมวลผลในเครื่องของคุณ
เริ่มดำเนินการวิเคราะห์ของคุณเอง!
nextflow run nf-core/cageseq -profile < docker/singularity/podman/conda/institute > --input ' *_R1.fastq.gz ' --aligner < ' star ' / ' bowtie1 ' > --genome GRCh38
ดูเอกสารการใช้งานสำหรับตัวเลือกทั้งหมดที่มีเมื่อใช้งานไปป์ไลน์
ตามค่าเริ่มต้น ไปป์ไลน์จะดำเนินการดังต่อไปนี้:
FastQC
)cutadapt
)SortMeRNA
)FastQC
)STAR
หรือ bowtie1
)paraclu
)RSeQC
)MultiQC
) ไปป์ไลน์ nf-core/cageseq มาพร้อมกับเอกสารเกี่ยวกับไปป์ไลน์: การใช้งานและเอาต์พุต
nf-core/cageseq เดิมเขียนโดย Kevin Menden (@KevinMenden) และ Tristan Kast (@TrisKast) และอัปเดตโดย Matthias Hörtenhuber (@mashehu)
หากคุณต้องการมีส่วนร่วมในไปป์ไลน์นี้ โปรดดูหลักเกณฑ์การมีส่วนร่วม
หากต้องการข้อมูลเพิ่มเติมหรือความช่วยเหลือ อย่าลังเลที่จะติดต่อช่อง Slack #cageseq
(คุณสามารถเข้าร่วมได้ด้วยคำเชิญนี้)
หากคุณใช้ nf-core/cageseq สำหรับการวิเคราะห์ของคุณ โปรดอ้างอิงโดยใช้ doi ต่อไปนี้: 10.5281/zenodo.4095105
คุณสามารถอ้างอิงสิ่งพิมพ์ nf-core
ได้ดังนี้:
กรอบงาน nf-core สำหรับไปป์ไลน์ชีวสารสนเทศที่ดูแลโดยชุมชน
ฟิลิป เอเวลส์, อเล็กซานเดอร์ เพลต์เซอร์, สเวน ฟิลเลอร์, ฮาร์ชิล ปาเทล, โยฮันเนส อัลเนเบิร์ก, อันเดรียส วิล์ม, มักซีม ยูลิส การ์เซีย, เปาโล ดิ ทอมมาโซ่ และ สเวน นาห์นเซ่น
แนท ไบโอเทคโนล. 13 ก.พ. 2563 ดอย: 10.1038/s41587-020-0439-x. ReadCube: ลิงก์การเข้าถึงแบบเต็ม
นอกจากนี้ การอ้างอิงเครื่องมือและข้อมูลที่ใช้ในไปป์ไลน์นี้มีดังนี้:
Di Tommaso P, Chatzou M, Floden EW, Barja PP, Palumbo E, Notredame C. Nextflow ช่วยให้เกิดเวิร์กโฟลว์การคำนวณที่ทำซ้ำได้ แนท ไบโอเทคโนล. 11 เม.ย. 2017;35(4):316-319. ดอย: 10.1038/nbt.3820. PubMed PMID: 28398311.
เบดเครื่องมือ
ควินแลน AR, ฮอลล์ IM BEDTools: ชุดยูทิลิตี้ที่ยืดหยุ่นสำหรับการเปรียบเทียบคุณสมบัติจีโนม ชีวสารสนเทศศาสตร์ 15 มี.ค. 2553;26(6):841-2. ดอย: 10.1093/ชีวสารสนเทศศาสตร์/btq033. Epub 2010 28 ม.ค. PubMed PMID: 20110278; PubMed เซ็นทรัล PMCID: PMC2832824.
หูกระต่าย
แลงมีด บี, แทรปเนล ซี, ป๊อป เอ็ม, ซัลซ์เบิร์ก เอสแอล การจัดลำดับลำดับ DNA สั้น ๆ เข้ากับจีโนมมนุษย์อย่างรวดเร็วและมีประสิทธิภาพในการจดจำ จีโนมไบโอล 2009;10(3):R25. ดอย: 10.1186/gb-2009-10-3-r25. Epub 2009 4 มี.ค. PMID: 19261174; PMCID: PMC2690996.
ตัด
Martin, M., 2011. Cutadapt ลบลำดับของอะแดปเตอร์ออกจากการอ่านลำดับที่มีปริมาณงานสูง เอ็มบีเน็ต วารสาร, 17(1), หน้า 10-12.
FastQC
มัลติคิวซี
Ewels P, Magnusson M, Lundin S, Käller M. MultiQC: สรุปผลการวิเคราะห์สำหรับเครื่องมือและตัวอย่างหลายรายการในรายงานฉบับเดียว ชีวสารสนเทศศาสตร์ 1 ต.ค. 2559 1;32(19):3047-8. ดอย: 10.1093/ชีวสารสนเทศศาสตร์/btw354. Epub 2016 16 มิ.ย. PubMed PMID: 27312411; PubMed เซ็นทรัล PMCID: PMC5039924.
พาราคลู
Frith MC, Valen E, Krogh A, Hayashizaki Y, Carninci P, Sandelin A. รหัสสำหรับการเริ่มต้นการถอดรหัสในจีโนมของสัตว์เลี้ยงลูกด้วยนม จีโนมเรส 2551 ม.ค.;18(1):1-12. ดอย: 10.1101/gr.6831208. Epub 2550 21 พ.ย. PMID: 18032727; PMCID: PMC2134772.
อาร์เอสคิวซี
Wang L, Wang S, Li W. RSeQC: การควบคุมคุณภาพของการทดลอง RNA-seq ชีวสารสนเทศศาสตร์ 2012 15 ส.ค.;28(16):2184-5. ดอย: 10.1093/ชีวสารสนเทศศาสตร์/bts356. Epub 2012 27 มิ.ย. PubMed PMID: 22743226
SAMtools
Li H, Handsaker B, ไวโซเกอร์ A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R; กลุ่มย่อยการประมวลผลข้อมูลโครงการจีโนม 1,000 รายการ รูปแบบการจัดตำแหน่ง/แผนที่และ SAMtools ชีวสารสนเทศศาสตร์ 2009 15 ส.ค.;25(16):2078-9. ดอย: 10.1093/ชีวสารสนเทศศาสตร์/btp352. Epub 2009 8 มิ.ย. PubMed PMID: 19505943; PubMed เซ็นทรัล PMCID: PMC2723002.
เรียงลำดับMeRNA
Kopylova E, Noé L, Touzet H. SortMeRNA: การกรองไรโบโซมอล RNA ที่รวดเร็วและแม่นยำในข้อมูลชีวสารสนเทศศาสตร์ metatranscriptomic 2012 15 ธ.ค.;28(24):3211-7. ดอย: 10.1093/ชีวสารสนเทศศาสตร์/bts611. Epub 2012 15 ต.ค. PubMed PMID: 23071270
ดาว
โดบิน เอ, เดวิส ซีเอ, ชเลซิงเกอร์ เอฟ, เดรนโคว์ เจ, ซาเลสกี้ ซี, เจฮา เอส, บาตุต พี, ไชส์สัน เอ็ม, จินเกรัส ทีอาร์ STAR: ชีวสารสนเทศศาสตร์การจัดตำแหน่ง RNA-seq สากลที่เร็วเป็นพิเศษ 1 ม.ค. 2556 1;29(1):15-21. ดอย: 10.1093/ชีวสารสนเทศศาสตร์/bts635. Epub 2012 25 ต.ค. PubMed PMID: 23104886; PubMed เซ็นทรัล PMCID: PMC3530905.
เครื่องมือ UCSC
Kent WJ, Zweig AS, Barber G, Hinrichs AS, Karolchik D. BigWig และ BigBed: ช่วยให้สามารถเรียกดูชุดข้อมูลแบบกระจายขนาดใหญ่ ชีวสารสนเทศศาสตร์ 2010 1 ก.ย.;26(17):2204-7. ดอย: 10.1093/ชีวสารสนเทศศาสตร์/btq351. Epub 2010 17 ก.ค. PubMed PMID: 20639541; PubMed เซ็นทรัล PMCID: PMC2922891.
อนาคอนด้า
การจัดจำหน่ายซอฟต์แวร์อนาคอนด้า ซอฟต์แวร์คอมพิวเตอร์ Vers. 2-2.4.0. อนาคอนดา พ.ย. 2559 เว็บ
ไบโอคอนด้า
กรูนิง บี, เดล อาร์, โจดิน เอ, แชปแมน บีเอ, โรว์ เจ, ทอมกินส์-ทิชช์ CH, วาเลียริส อาร์, คอสเตอร์ เจ; ทีมงานไบโอคอนด้า. Bioconda: การกระจายซอฟต์แวร์ที่ยั่งยืนและครอบคลุมสำหรับวิทยาศาสตร์ชีวภาพ วิธีการแนท 2018 ก.ค.;15(7):475-476. ดอย: 10.1038/s41592-018-0046-7. PubMed PMID: 29967506.
ไบโอคอนเทนเนอร์
ดา เวก้า เลพรีโวสต์ เอฟ, กรูนิง บี, อัฟลิตอส เอสเอ, เรอสท์ เอชแอล, อุสโคเรท เจ, บาร์สเนส เอช, โวเดล เอ็ม, โมเรโน พี, กัตโต แอล, เวเบอร์ เจ, ไบ เอ็ม, จิเมเนซ อาร์ซี, ซัคเซนเบิร์ก ที, ไฟฟ์เฟอร์ เจ, อัลวาเรซ อาร์วี, กริส เจ, Nesvizhskii AI, Perez-Riverol Y. BioContainers: เฟรมเวิร์กโอเพ่นซอร์สและขับเคลื่อนโดยชุมชน สำหรับการกำหนดมาตรฐานซอฟต์แวร์ ชีวสารสนเทศศาสตร์ 2017 15 ส.ค.;33(16):2580-2582. ดอย: 10.1093/ชีวสารสนเทศศาสตร์/btx192. PubMed PMID: 28379341; PubMed เซ็นทรัล PMCID: PMC5870671.
นักเทียบท่า
ภาวะเอกฐาน
เคิร์ตเซอร์ จีเอ็ม, โซแชท วี, บาวเออร์ MW. ภาวะเอกฐาน: คอนเทนเนอร์ทางวิทยาศาสตร์เพื่อความคล่องตัวในการประมวลผล กรุณาหนึ่ง 11 พฤษภาคม 2017;12(5):e0177459. ดอย: 10.1371/journal.pone.0177459. eCollection 2017. PubMed PMID: 28494014; PubMed เซ็นทรัล PMCID: PMC5426675.