คอลเลกชันของไลบรารี Python เพื่อแยกวิเคราะห์ไฟล์ชีวสารสนเทศศาสตร์ หรือดำเนินการคำนวณที่เกี่ยวข้องกับการประกอบ คำอธิบายประกอบ และจีโนมเชิงเปรียบเทียบ
ผู้เขียน | Haibao Tang (ถังไห่เปา) |
วิเวกกฤษณกุมาร (วิเวกกฤษณะ) | |
ซิงถัน จาง (ทังเงอร์จาง) | |
วอนชอลยิ้ม (wyim-pgl) | |
อีเมล | [email protected] |
ใบอนุญาต | บีเอสดี |
เคล็ดลับ
JCVI ได้รับการเผยแพร่แล้วใน iMeta!
ถังและคณะ (2024) JCVI: ชุดเครื่องมืออเนกประสงค์สำหรับการวิเคราะห์จีโนมเชิงเปรียบเทียบ iMeta
โมดูลต่อไปนี้เป็นวิธีการจัดการชีวสารสนเทศทั่วไป
อัลกอริธึม
แอพ
รูปแบบ
ปัจจุบันรองรับรูปแบบ .ace
(phrap, cap3 ฯลฯ), .agp
(goldenpath), รูปแบบ .bed
, เอาต์พุต .blast
, รูปแบบ .btab
, รูปแบบ .coords
(เอาต์พุต nucmer
), รูปแบบ .fasta
, รูปแบบ .fastq
, .fpc
รูปแบบ, รูปแบบ .gff
, รูปแบบ obo
(ภววิทยา), รูปแบบ .psl
(UCSC blat, GMAP ฯลฯ ), รูปแบบ .posmap
(เอาต์พุตแอสเซมเบลอร์ Celera) รูปแบบ .sam
(การอ่านแผนที่), รูปแบบ .contig
(รูปแบบแอสเซมบลี TIGR) ฯลฯ
กราฟิก
ยูทิลิตี้
มีโมดูลที่มีวิธีการเฉพาะโดเมนอยู่
การประกอบ
คำอธิบายประกอบ
เปรียบเทียบ
กรุณาเยี่ยมชมวิกิเพื่อดูแอปพลิเคชันเต็มรูปแบบ
ต่อไปนี้เป็นรายการแพ็คเกจ Python ของบริษัทอื่นที่ใช้โดยรูทีนบางตัวในไลบรารี การขึ้นต่อกันเหล่านี้ ไม่ ได้บังคับเนื่องจากมีการใช้งานเพียงไม่กี่โมดูลเท่านั้น
มีโมดูล Python อื่นๆ ที่นี่และที่นั่นในสคริปต์ต่างๆ วิธีที่ดีที่สุดคือติดตั้งผ่าน pip install
เมื่อคุณเห็น ImportError
วิธีที่ง่ายที่สุดคือการติดตั้งผ่าน PyPI:
pip install jcvi
ในการติดตั้งเวอร์ชันการพัฒนา:
pip install git+git://github.com/tanghaibao/jcvi.git
หรือหากคุณต้องการติดตั้งด้วยตนเอง:
cd ~/code # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .
นอกจากนี้ บางโมดูลอาจถามถึงตำแหน่งของโปรแกรมภายนอก หากไม่พบส่วนขยายใน PATH
ของคุณ โปรแกรมภายนอกที่มักใช้ได้แก่:
สคริปต์ส่วนใหญ่ในแพ็คเกจนี้มีหลายการกระทำ หากต้องการใช้ตัวอย่าง fasta
:
Usage:
python -m jcvi.formats.fasta ACTION
Available ACTIONs:
clean | Remove irregular chars in FASTA seqs
diff | Check if two fasta records contain same information
extract | Given fasta file and seq id, retrieve the sequence in fasta format
fastq | Combine fasta and qual to create fastq file
filter | Filter the records by size
format | Trim accession id to the first space or switch id based on 2-column mapping file
fromtab | Convert 2-column sequence file to FASTA format
gaps | Print out a list of gap sizes within sequences
gc | Plot G+C content distribution
identical | Given 2 fasta files, find all exactly identical records
ids | Generate a list of headers
info | Run `sequence_info` on fasta files
ispcr | Reformat paired primers into isPcr query format
join | Concatenate a list of seqs and add gaps in between
longestorf | Find longest orf for CDS fasta
pair | Sort paired reads to .pairs, rest to .fragments
pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
pool | Pool a bunch of fastafiles together and add prefix
qual | Generate dummy .qual file based on FASTA file
random | Randomly take some records
sequin | Generate a gapped fasta file for sequin submission
simulate | Simulate random fasta file for testing
some | Include or exclude a list of records (also performs on .qual file if available)
sort | Sort the records by IDs, sizes, etc.
summary | Report the real no of bases and N's in fasta files
tidy | Normalize gap sizes and remove small components in fasta
translate | Translate CDS to proteins
trim | Given a cross_match screened fasta, trim the sequence
trimsplit | Split sequences at lower-cased letters
uniq | Remove records that are the same
จากนั้นคุณต้องใช้การกระทำเดียว คุณสามารถทำได้:
python -m jcvi.formats.fasta extract
นี่จะบอกตัวเลือกและข้อโต้แย้งที่คาดหวังให้คุณทราบ
อย่าลังเลที่จะตรวจสอบสคริปต์อื่นๆ ในแพ็คเกจ ไม่ใช่เฉพาะสำหรับ FASTA เท่านั้น