用於解析生物資訊學文件或執行與組裝、註釋和比較基因組學相關的計算的 Python 庫集合。
作者 | 海寶堂 (tanghaibao) |
維韋克‧克里希納庫瑪 (vivekkrish) | |
張杏壇 (tangerzhang) | |
嚴元哲 (wyim-pgl) | |
電子郵件 | [email protected] |
執照 | BSD |
提示
JCVI 現已在 iMeta 發布!
唐等人。 (2024) JCVI:用於比較基因組分析的多功能工具包。易元
以下模組可用作通用生物資訊處理方法。
演算法
應用程式
格式
目前支援.ace
格式(phrap、cap3等)、. .agp
(goldenpath)、. .bed
格式、 .blast
輸出、 .btab
格式、 .coords
格式( nucmer
輸出)、. .fasta
格式、 .fastq
格式、 .fpc
格式、 .gff
格式、 obo
格式(本體)、. .psl
格式(UCSC blat、GMAP 等)、. .posmap
格式(Celera 組譯器輸出)、. .sam
格式(讀取對應)、. .contig
格式(TIGR 彙編格式) , ETC 。
圖形
實用程式
然後是包含特定於域的方法的模組。
集會
註解
比較
請造訪 wiki 以了解完整的應用程式。
以下是庫中某些例程使用的第三方 python 套件的清單。這些依賴項不是強制性的,因為它們僅由少數模組使用。
各種腳本中到處都有其他 Python 模組。最好的方法是當您看到ImportError
時透過pip install
安裝它們。
最簡單的方法是透過 PyPI 安裝它:
pip install jcvi
安裝開發版本:
pip install git+git://github.com/tanghaibao/jcvi.git
或者,如果您想手動安裝:
cd ~/code # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .
此外,如果在您的PATH
中找不到擴充程序,某些模組可能會詢問外部程式的位置。經常使用的外部程式有:
該套件中的大多數腳本都包含多個操作。使用fasta
範例:
Usage:
python -m jcvi.formats.fasta ACTION
Available ACTIONs:
clean | Remove irregular chars in FASTA seqs
diff | Check if two fasta records contain same information
extract | Given fasta file and seq id, retrieve the sequence in fasta format
fastq | Combine fasta and qual to create fastq file
filter | Filter the records by size
format | Trim accession id to the first space or switch id based on 2-column mapping file
fromtab | Convert 2-column sequence file to FASTA format
gaps | Print out a list of gap sizes within sequences
gc | Plot G+C content distribution
identical | Given 2 fasta files, find all exactly identical records
ids | Generate a list of headers
info | Run `sequence_info` on fasta files
ispcr | Reformat paired primers into isPcr query format
join | Concatenate a list of seqs and add gaps in between
longestorf | Find longest orf for CDS fasta
pair | Sort paired reads to .pairs, rest to .fragments
pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
pool | Pool a bunch of fastafiles together and add prefix
qual | Generate dummy .qual file based on FASTA file
random | Randomly take some records
sequin | Generate a gapped fasta file for sequin submission
simulate | Simulate random fasta file for testing
some | Include or exclude a list of records (also performs on .qual file if available)
sort | Sort the records by IDs, sizes, etc.
summary | Report the real no of bases and N's in fasta files
tidy | Normalize gap sizes and remove small components in fasta
translate | Translate CDS to proteins
trim | Given a cross_match screened fasta, trim the sequence
trimsplit | Split sequences at lower-cased letters
uniq | Remove records that are the same
然後你需要使用一個動作,你可以這樣做:
python -m jcvi.formats.fasta extract
這將告訴您它期望的選項和參數。
請隨意查看包中的其他腳本,它不僅適用於 FASTA。