Kumpulan pustaka Python untuk mengurai file bioinformatika, atau melakukan komputasi terkait perakitan, anotasi, dan genomik komparatif.
Penulis | Haibao Tang (tanghaibao) |
Vivek Krishnakumar (vivekkrish) | |
Xingtan Zhang (tangerzhang) | |
Won Cheol Yim (wyim-pgl) | |
[email protected] | |
Lisensi | BSD |
Tip
JCVI sekarang diterbitkan di iMeta!
Tang dkk. (2024) JCVI: Perangkat Serbaguna untuk Analisis Genomik Komparatif. iMeta
Modul berikut tersedia sebagai metode penanganan Bioinformatika generik.
algoritma
aplikasi
format
Saat ini mendukung format .ace
(phrap, cap3, dll.), .agp
(goldenpath), format .bed
, output .blast
, format .btab
, format .coords
(output nucmer
), format .fasta
, format .fastq
, .fpc
format, format .gff
, format obo
(ontologi), format .psl
(UCSC blat, GMAP, dll.), format .posmap
(keluaran assembler Celera), format .sam
(pemetaan baca), format .contig
(format perakitan TIGR), dll.
grafis
utilitas
Lalu ada modul yang berisi metode khusus domain.
perakitan
anotasi
membandingkan
Silakan kunjungi wiki untuk aplikasi lengkap.
Berikut adalah daftar paket python pihak ketiga yang digunakan oleh beberapa rutinitas di perpustakaan. Ketergantungan ini tidak wajib karena hanya digunakan oleh beberapa modul.
Ada modul Python lain di sana-sini dalam berbagai skrip. Cara terbaik adalah menginstalnya melalui pip install
ketika Anda melihat ImportError
.
Cara termudah adalah menginstalnya melalui PyPI:
pip install jcvi
Untuk menginstal versi pengembangan:
pip install git+git://github.com/tanghaibao/jcvi.git
Alternatifnya, jika Anda ingin menginstal secara manual:
cd ~/code # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .
Selain itu, beberapa modul mungkin menanyakan lokasi program eksternal, jika perluasan tidak dapat ditemukan di PATH
Anda. Program eksternal yang sering digunakan adalah:
Sebagian besar skrip dalam paket ini berisi banyak tindakan. Untuk menggunakan contoh fasta
:
Usage:
python -m jcvi.formats.fasta ACTION
Available ACTIONs:
clean | Remove irregular chars in FASTA seqs
diff | Check if two fasta records contain same information
extract | Given fasta file and seq id, retrieve the sequence in fasta format
fastq | Combine fasta and qual to create fastq file
filter | Filter the records by size
format | Trim accession id to the first space or switch id based on 2-column mapping file
fromtab | Convert 2-column sequence file to FASTA format
gaps | Print out a list of gap sizes within sequences
gc | Plot G+C content distribution
identical | Given 2 fasta files, find all exactly identical records
ids | Generate a list of headers
info | Run `sequence_info` on fasta files
ispcr | Reformat paired primers into isPcr query format
join | Concatenate a list of seqs and add gaps in between
longestorf | Find longest orf for CDS fasta
pair | Sort paired reads to .pairs, rest to .fragments
pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
pool | Pool a bunch of fastafiles together and add prefix
qual | Generate dummy .qual file based on FASTA file
random | Randomly take some records
sequin | Generate a gapped fasta file for sequin submission
simulate | Simulate random fasta file for testing
some | Include or exclude a list of records (also performs on .qual file if available)
sort | Sort the records by IDs, sizes, etc.
summary | Report the real no of bases and N's in fasta files
tidy | Normalize gap sizes and remove small components in fasta
translate | Translate CDS to proteins
trim | Given a cross_match screened fasta, trim the sequence
trimsplit | Split sequences at lower-cased letters
uniq | Remove records that are the same
Maka Anda perlu menggunakan satu tindakan, Anda cukup melakukan:
python -m jcvi.formats.fasta extract
Ini akan memberi tahu Anda opsi dan argumen yang diharapkan.
Jangan ragu untuk memeriksa skrip lain dalam paket, ini bukan hanya untuk FASTA.