用于解析生物信息学文件或执行与组装、注释和比较基因组学相关的计算的 Python 库集合。
作者 | 海宝堂 (tanghaibao) |
维韦克·克里希纳库玛 (vivekkrish) | |
张杏坛 (tangerzhang) | |
严元哲 (wyim-pgl) | |
电子邮件 | [email protected] |
执照 | BSD |
提示
JCVI 现已在 iMeta 发布!
唐等人。 (2024) JCVI:用于比较基因组分析的多功能工具包。易元
以下模块可用作通用生物信息学处理方法。
算法
应用程序
格式
目前支持.ace
格式(phrap、cap3等)、. .agp
(goldenpath)、. .bed
格式、 .blast
输出、 .btab
格式、 .coords
格式( nucmer
输出)、. .fasta
格式、 .fastq
格式、 .fpc
格式、 .gff
格式、 obo
格式(本体)、. .psl
格式(UCSC blat、GMAP 等)、. .posmap
格式(Celera 汇编器输出)、. .sam
格式(读取映射)、. .contig
格式(TIGR 汇编格式) , ETC。
图形
实用程序
然后是包含特定于域的方法的模块。
集会
注解
比较
请访问 wiki 了解完整的应用程序。
以下是库中某些例程使用的第三方 python 包的列表。这些依赖项不是强制性的,因为它们仅由少数模块使用。
各种脚本中到处都有其他 Python 模块。最好的方法是当您看到ImportError
时通过pip install
安装它们。
最简单的方法是通过 PyPI 安装它:
pip install jcvi
安装开发版本:
pip install git+git://github.com/tanghaibao/jcvi.git
或者,如果您想手动安装:
cd ~/code # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .
此外,如果在您的PATH
中找不到扩展程序,某些模块可能会询问外部程序的位置。经常使用的外部程序有:
该包中的大多数脚本都包含多个操作。使用fasta
示例:
Usage:
python -m jcvi.formats.fasta ACTION
Available ACTIONs:
clean | Remove irregular chars in FASTA seqs
diff | Check if two fasta records contain same information
extract | Given fasta file and seq id, retrieve the sequence in fasta format
fastq | Combine fasta and qual to create fastq file
filter | Filter the records by size
format | Trim accession id to the first space or switch id based on 2-column mapping file
fromtab | Convert 2-column sequence file to FASTA format
gaps | Print out a list of gap sizes within sequences
gc | Plot G+C content distribution
identical | Given 2 fasta files, find all exactly identical records
ids | Generate a list of headers
info | Run `sequence_info` on fasta files
ispcr | Reformat paired primers into isPcr query format
join | Concatenate a list of seqs and add gaps in between
longestorf | Find longest orf for CDS fasta
pair | Sort paired reads to .pairs, rest to .fragments
pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
pool | Pool a bunch of fastafiles together and add prefix
qual | Generate dummy .qual file based on FASTA file
random | Randomly take some records
sequin | Generate a gapped fasta file for sequin submission
simulate | Simulate random fasta file for testing
some | Include or exclude a list of records (also performs on .qual file if available)
sort | Sort the records by IDs, sizes, etc.
summary | Report the real no of bases and N's in fasta files
tidy | Normalize gap sizes and remove small components in fasta
translate | Translate CDS to proteins
trim | Given a cross_match screened fasta, trim the sequence
trimsplit | Split sequences at lower-cased letters
uniq | Remove records that are the same
然后你需要使用一个动作,你可以这样做:
python -m jcvi.formats.fasta extract
这将告诉您它期望的选项和参数。
请随意查看包中的其他脚本,它不仅仅适用于 FASTA。