ดาวน์โหลด jcvi - ดาวน์โหลดซอร์สโค้ด jcvi

jcvi

ซอร์สโค้ดอื่น ๆ

ดาวน์โหลด

JCVI: ชุดเครื่องมืออเนกประสงค์สำหรับการวิเคราะห์จีโนมเชิงเปรียบเทียบ

คอลเลกชันของไลบรารี Python เพื่อแยกวิเคราะห์ไฟล์ชีวสารสนเทศศาสตร์ หรือดำเนินการคำนวณที่เกี่ยวข้องกับการประกอบ คำอธิบายประกอบ และจีโนมเชิงเปรียบเทียบ


ผู้เขียน	Haibao Tang (ถังไห่เปา)
	วิเวกกฤษณกุมาร (วิเวกกฤษณะ)
	ซิงถัน จาง (ทังเงอร์จาง)
	วอนชอลยิ้ม (wyim-pgl)
อีเมล	[email protected]
ใบอนุญาต	บีเอสดี

วิธีการอ้างอิง

เคล็ดลับ

JCVI ได้รับการเผยแพร่แล้วใน iMeta!

ถังและคณะ (2024) JCVI: ชุดเครื่องมืออเนกประสงค์สำหรับการวิเคราะห์จีโนมเชิงเปรียบเทียบ iMeta

สารบัญ

โมดูลต่อไปนี้เป็นวิธีการจัดการชีวสารสนเทศทั่วไป

อัลกอริธึม
- ตัวแก้ปัญหาการเขียนโปรแกรมเชิงเส้นด้วย SCIP และ GLPK
- Supermap: ค้นหาชุดของจุดยึดที่ไม่ทับซ้อนกันในเอาต์พุต BLAST หรือ NUCMER
- ลำดับที่เพิ่มขึ้นที่ยาวที่สุดหรือหนักที่สุด
- การดำเนินงานเมทริกซ์
แอพ
- ภาคยานุวัติของ GenBank, Phytozome, Ensembl และ SRA downloader
- คำนวณอัตราการทดแทน (ไม่) ตรงกันระหว่างคู่ยีน
- การสร้างต้นไม้สายวิวัฒนาการขั้นพื้นฐานโดยใช้ PHYLIP, PhyML หรือ RAxML และการสร้างภาพ
- กระดาษห่อสำหรับ BLAST+, LASTZ, LAST, BWA, BOWTIE2, CLC, CDHIT, CAP3 ฯลฯ
รูปแบบ
ปัจจุบันรองรับรูปแบบ .ace (phrap, cap3 ฯลฯ), .agp (goldenpath), รูปแบบ .bed , เอาต์พุต .blast , รูปแบบ .btab , รูปแบบ .coords (เอาต์พุต nucmer ), รูปแบบ .fasta , รูปแบบ .fastq , .fpc รูปแบบ, รูปแบบ .gff , รูปแบบ obo (ภววิทยา), รูปแบบ .psl (UCSC blat, GMAP ฯลฯ ), รูปแบบ .posmap (เอาต์พุตแอสเซมเบลอร์ Celera) รูปแบบ .sam (การอ่านแผนที่), รูปแบบ .contig (รูปแบบแอสเซมบลี TIGR) ฯลฯ
กราฟิก
- BLAST หรือพล็อตจุด synteny
- ฮิสโตแกรมโดยใช้งานศิลปะ R และ ASCII
- ระบายสีบริเวณบนชุดโครโมโซม
- แปลงมาโครซินเทนีและไมโครซินเทนี
ยูทิลิตี้
- ปลาเก๋าสามารถใช้เป็นโครงสร้างข้อมูลชุดที่ไม่เป็นสมาชิกร่วมได้
- range ประกอบด้วยการดำเนินการของช่วงทั่วไป เช่น การทับซ้อนและการผูกมัด
- สูตรตำราอาหารเบ็ดเตล็ด ตัวตกแต่งตัววนซ้ำ สาธารณูปโภคบนโต๊ะอาหาร

มีโมดูลที่มีวิธีการเฉพาะโดเมนอยู่

การประกอบ
- การวิเคราะห์ฮิสโตแกรมของเคเมอร์
- การเตรียมและการตรวจสอบความถูกต้องของเส้นทางการปูกระเบื้องสำหรับชุดประกอบแบบโคลน
- นั่งร้านผ่าน ALLMAPS แผนที่เชิงแสง และแผนที่พันธุกรรม
- ขั้นตอนการควบคุมคุณภาพก่อนการประกอบและหลังการประกอบ
คำอธิบายประกอบ
- การฝึกอบรมตัวทำนายยีน ab initio
- คำนวณสถิติของยีน เอ็กซอน และอินตรอน
- กระดาษห่อสำหรับ PASA และ EVM
- เรียกใช้กระบวนการ MAKER หลายรายการ
เปรียบเทียบ
- ตัวกรอง BLAST ที่ใช้คะแนน C
- สแกน Synteny (เดอโนโว) และยกขึ้น (ค้นหาจุดยึดใกล้เคียง)
- การสร้างจีโนมของบรรพบุรุษใหม่โดยใช้วิธี Sankoff และ PAR
- ตัวค้นหายีน Ortholog และ Tandem ซ้ำกัน

การใช้งาน

กรุณาเยี่ยมชมวิกิเพื่อดูแอปพลิเคชันเต็มรูปแบบ

การพึ่งพาอาศัยกัน

ต่อไปนี้เป็นรายการแพ็คเกจ Python ของบริษัทอื่นที่ใช้โดยรูทีนบางตัวในไลบรารี การขึ้นต่อกันเหล่านี้ ไม่ ได้บังคับเนื่องจากมีการใช้งานเพียงไม่กี่โมดูลเท่านั้น

ไบโอไพทอน
มากมาย
matplotlib

มีโมดูล Python อื่นๆ ที่นี่และที่นั่นในสคริปต์ต่างๆ วิธีที่ดีที่สุดคือติดตั้งผ่าน pip install เมื่อคุณเห็น ImportError

การติดตั้ง

วิธีที่ง่ายที่สุดคือการติดตั้งผ่าน PyPI:

 pip install jcvi

ในการติดตั้งเวอร์ชันการพัฒนา:

 pip install git+git://github.com/tanghaibao/jcvi.git

หรือหากคุณต้องการติดตั้งด้วยตนเอง:

 cd ~/code  # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .

นอกจากนี้ บางโมดูลอาจถามถึงตำแหน่งของโปรแกรมภายนอก หากไม่พบส่วนขยายใน PATH ของคุณ โปรแกรมภายนอกที่มักใช้ได้แก่:

เครื่องมือของเคนท์
เครื่องนอน
นูน

สคริปต์ส่วนใหญ่ในแพ็คเกจนี้มีหลายการกระทำ หากต้องการใช้ตัวอย่าง fasta :

 Usage:
    python -m jcvi.formats.fasta ACTION


Available ACTIONs:
          clean | Remove irregular chars in FASTA seqs
           diff | Check if two fasta records contain same information
        extract | Given fasta file and seq id, retrieve the sequence in fasta format
          fastq | Combine fasta and qual to create fastq file
         filter | Filter the records by size
         format | Trim accession id to the first space or switch id based on 2-column mapping file
        fromtab | Convert 2-column sequence file to FASTA format
           gaps | Print out a list of gap sizes within sequences
             gc | Plot G+C content distribution
      identical | Given 2 fasta files, find all exactly identical records
            ids | Generate a list of headers
           info | Run `sequence_info` on fasta files
          ispcr | Reformat paired primers into isPcr query format
           join | Concatenate a list of seqs and add gaps in between
     longestorf | Find longest orf for CDS fasta
           pair | Sort paired reads to .pairs, rest to .fragments
    pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
           pool | Pool a bunch of fastafiles together and add prefix
           qual | Generate dummy .qual file based on FASTA file
         random | Randomly take some records
         sequin | Generate a gapped fasta file for sequin submission
       simulate | Simulate random fasta file for testing
           some | Include or exclude a list of records (also performs on .qual file if available)
           sort | Sort the records by IDs, sizes, etc.
        summary | Report the real no of bases and N's in fasta files
           tidy | Normalize gap sizes and remove small components in fasta
      translate | Translate CDS to proteins
           trim | Given a cross_match screened fasta, trim the sequence
      trimsplit | Split sequences at lower-cased letters
           uniq | Remove records that are the same