deviaTE เป็นเครื่องมือหลามสำหรับการวิเคราะห์และการแสดงภาพลำดับองค์ประกอบทางพันธุกรรมที่เคลื่อนที่ได้
การตั้งค่าสถานะบรรทัดคำสั่งใหม่ --tar
เพื่อรวบรวมผลลัพธ์และแปลงในไฟล์ tar มีประโยชน์ในกรณีที่มีการวิเคราะห์ TE seqs จำนวนมาก
เพิ่มข้อมูลการทดสอบ nanopore และการทดสอบหน่วย
แก้ไขปัญหาคู่การอ่านที่ต่อกันซึ่งมีชื่อเดียวกัน สิ่งนี้เคยต้องใช้ scripts/rename_reads.py
เพื่อทำให้ชื่อไม่ซ้ำกัน ขณะนี้ได้รับการจัดการภายในแล้ว ดังนั้นการใช้สคริปต์จึงไม่จำเป็นอีกต่อไป
การตั้งค่าสถานะบรรทัดคำสั่งใหม่ --no_viz
เพื่อป้องกันการแสดงภาพหากไม่จำเป็น
การปรับปรุงประสิทธิภาพภายใน
แก้ไขการใช้งานไฟล์อินพุต gzipped รวมถึงกรณีทดสอบใหม่
เนื่องจากฐาน python ก่อนหน้านี้หมดอายุการใช้งานแล้ว deviaTE จึงจำเป็นต้องมีการอัปเดต การอัปเดตนี้ค่อนข้างสำคัญ - จึงเปลี่ยนเป็นเวอร์ชัน 2:
การเลิกใช้งานคุณลักษณะ:
deviaTE ต้องการ python >=3.10 และ pip:
pip install deviaTE
usage: deviaTE [-h] [--input INPUT] [--preset {sr,map-ont,map-pb,map-hifi}] [--library LIBRARY] [--annotation ANNOTATION] [--min_align_len MIN_ALIGN_LEN] [--families [FAMILIES ...]] [--no_viz] [-v] [--rpm | --single_copy_genes [SINGLE_COPY_GENES ...]]
options:
-h, --help show this help message and exit
--input INPUT Input file(s) to be analysed. Can be *.fastq, *.fa, or directory of files. Optionally gzipped.
--preset {sr,map-ont,map-pb,map-hifi} Minimap2 mapping preset. (sr, map-ont, map-pb, map-hifi) [sr]
--library LIBRARY Path to reference library. Defaults to drosophila transposons from https://github.com/bergmanlab/drosophila-transposons
--annotation ANNOTATION Path to annotation (gff) of sequences in library. Defaults to drosophila TE annotation from https://github.com/bergmanlab/drosophila-transposons
--min_align_len MIN_ALIGN_LEN Minimum length of valid alignments
--families [FAMILIES ...] Which transposon families to analyse. Default: all sequences in library.
--no_viz Only analyse, but don't visualize the results
-v, --version Show version information and exit.
--rpm normalize all abundances by reads per million
--single_copy_genes [SINGLE_COPY_GENES ...] space-separated names of single-copy genes in reference to use for normalisation
DeviaTE เป็นโปรแกรมบรรทัดคำสั่งที่วิเคราะห์และแสดงภาพความหลากหลายขององค์ประกอบทางพันธุกรรมที่เคลื่อนที่ได้จากการเรียงลำดับข้อมูล โดยไม่จำเป็นต้องรวบรวมจีโนมของสายพันธุ์พืชอาศัย อาร์กิวเมนต์ที่จำเป็นเพียงอย่างเดียวคือ --input
สำหรับสิ่งนี้ จะใช้ข้อมูลตามลำดับ ( --input
ไฟล์เดียวหรือไดเร็กทอรีของไฟล์) สามารถใช้กับการอ่านแบบสั้นและแบบยาว ( --preset
, ตั้งค่าพารามิเตอร์ minimap2 สำหรับการอ่านแบบสั้น [sr], nanopore อ่าน [map-ont] หรือ pacbio [map-pb, map-hifi]) นอกจากนี้ยังต้องมีลำดับฉันทามติขององค์ประกอบทางพันธุกรรมแบบเคลื่อนที่ ( --library
, ไฟล์ fasta) หากไม่มีการให้ไลบรารี จะใช้ลำดับ transposon ของ Drosphila จาก https://github.com/bergmanlab/drosophila-transposons TE ที่จะวิเคราะห์จะถูกเลือกด้วย --families
สิ่งเหล่านี้สามารถเป็นได้หลายรายการ (คั่นด้วยช่องว่าง) หรือหากไม่ได้ระบุ ลำดับการอ้างอิงทั้งหมดในไลบรารีจะถูกใช้
อาร์กิวเมนต์ที่มีอยู่จะแสดงรายการด้วย -h
หรือ --help
มีตัวอย่างสำหรับการทดสอบ ลำดับมาจาก Drosophila 12 Genomes Consortium และคณะ 2550. วิวัฒนาการของยีนและจีโนมบนสายวิวัฒนาการดรอสโซฟิล่า. ธรรมชาติ . 450(7167):203-218.
เราสามารถวิเคราะห์ TE jockey (DMLINEJA) และรับการแสดงภาพโดยใช้:
deviaTE --input ../data/jockey_dmel.fastq --families FBte0000088
สิ่งนี้จะสร้างไฟล์การจัดตำแหน่งที่เรียกว่า jockey_dmel.fastq.paf
สร้างตารางเอาต์พุต jockey_dmel.fastq.FBte0000088.deviate
พร้อมด้วยข้อมูลเกี่ยวกับความครอบคลุมและการแทรกโดยประมาณ (หากเลือก) และการแสดงภาพ jockey_dmel.fastq.FBte0000088.deviate.pdf
สามารถดูคู่มือและบทสรุปของเวอร์ชันก่อนหน้าได้ (ที่ลิงก์ GitHub นี้)
ตารางเริ่มต้นด้วยบรรทัดส่วนหัวที่แสดงด้วย # ส่วนหัวนี้มีจำนวนการแทรก TE โดยประมาณ (หากเลือก) และชื่อคอลัมน์ แต่ละแถวสอดคล้องกับหนึ่งตำแหน่งของลำดับ TE ตั้งแต่เวอร์ชัน 2 hq_cov
รายงานความครอบคลุมของฐานคุณภาพสูงแทนการแมปคุณภาพสูง เนื่องจากมีความน่าสนใจมากกว่า เช่น ข้อมูล nanopore
คอลัมน์ | คำอธิบาย |
---|---|
TEfam | ชื่อของตระกูล TE ที่วิเคราะห์ |
sample_id | ชื่อไฟล์อินพุต |
pos | ตำแหน่งในลำดับการอ้างอิง |
refbase | นิวคลีโอไทด์ในลำดับอ้างอิงที่ตำแหน่งนี้ |
ACGT | จำนวนนิวคลีโอไทด์แต่ละตัวในตำแหน่งนี้ |
cov | ความคุ้มครองรวมในตำแหน่งนี้ |
hq_cov | ครอบคลุมฐานคุณภาพสูงเท่านั้น (>Q15) |
snp | ตัวบ่งชี้สำหรับตำแหน่งตัวแปร |
delet | จำนวนการสังเกตช่องว่าง |
ตามค่าเริ่มต้น ไม่มีการดำเนินการทำให้เป็นมาตรฐานและการนับที่รายงานเป็นปริมาณดิบ ซึ่งไม่เหมาะสำหรับการเปรียบเทียบ TE ระหว่างตัวอย่าง ดังนั้นจึงมีการใช้กลยุทธ์ที่แตกต่างกันสองแบบ ได้แก่ การทำให้เป็นมาตรฐานต่อการอ่านแมปล้านครั้ง และการทำให้เป็นมาตรฐานด้วยยีนที่มีสำเนาเดียว
--rpm
--library
จากนั้นเพิ่ม --single_copy_genes GENE1 GENE2 GENE3 ...
โดยที่ GENE1 ฯลฯ เป็นส่วนหัวในไฟล์ไลบรารี จำนวนสำเนาโดยประมาณต่อจีโนมเดี่ยวจะถูกเขียนลงในส่วนหัวของตารางผลลัพธ์ผลลัพธ์ หากคุณกำลังวิเคราะห์ TE ใน Drosophila การระบุ --library
หรือ --annotation
ของลำดับการอ้างอิงเป็นทางเลือก ตามค่าเริ่มต้น deviaTE จะดาวน์โหลดและใช้ไลบรารี TE จาก https://github.com/bergmanlab/drosophila-transposons โดยอัตโนมัติ หากไม่มีการให้ไลบรารีและคำอธิบายประกอบ
สำหรับการทำให้เป็นมาตรฐานของยีนที่มีสำเนาเดียวในดรอสโซฟิล่า ยีนห้ายีนจะถูกเพิ่มลงในไลบรารีโดยอัตโนมัติ (Dmel_rpl32, Dmel_piwi, Dmel_Act5C, Dmel_RpII140 และ Dmel_p53) ซึ่งสามารถใช้สำหรับการทำให้เป็นมาตรฐาน:
--single_copy_genes Dmel_rpl32 Dmel_piwi ...
คุณสามารถใช้ DeviaTE สำหรับการอ่านแบบปลายคู่ได้โดยการแมปพวกมันในโหมดอ่านเดี่ยว
ซึ่งสามารถทำได้ เช่น โดยใช้ไฟล์ fastq ที่ต่อกันเพียงไฟล์เดียวซึ่งมีทั้งคู่การอ่าน (read1 และ read2) (การใช้สคริปต์ scripts/rename_reads.py
เพื่อตั้งชื่อเฉพาะให้กับเพื่อนนั้นไม่จำเป็นอีกต่อไป ซึ่งดำเนินการเป็นการภายในตั้งแต่ 2.2.0)
มีบทความอธิบาย deviaTE อยู่ที่นี่: https://onlinelibrary.wiley.com/doi/10.1111/1755-0998.13030
@article{weilguny2019,
title = {{{DeviaTE}}: {{Assembly-free}} Analysis and Visualization of Mobile Genetic Element Composition},
author = {Weilguny, Lukas and Kofler, Robert},
year = {2019},
journal = {Molecular Ecology Resources},
volume = {19},
number = {5},
pages = {1346--1354},
doi = {10.1111/1755-0998.13030}
}
หากคุณพบปัญหาใดๆ มีคำถามหรือแนวคิดสำหรับการปรับปรุงเพิ่มเติม โปรดใช้เครื่องมือติดตามปัญหาในพื้นที่เก็บข้อมูลนี้ ขอบคุณ!
deviaTE ได้รับอนุญาตภายใต้ใบอนุญาต GPLv3
รหัสถูกครอบคลุมโดย pytests หากต้องการเรียกใช้การติดตั้งเหล่านี้: pip install pytest pytest-cov
จากนั้นรันการทดสอบ: cd tests; pytest --cov --cov-report html
วิธีทดสอบบิลด์ในเครื่อง: hatch build && pip install dist/deviate-2.2.0-py3-none-any.whl --force-reinstall --no-deps