バイオインフォマティクス ファイルを解析したり、アセンブリ、アノテーション、および比較ゲノミクスに関連する計算を実行したりするための Python ライブラリのコレクション。
著者 | 海宝堂(タンハイバオ) |
ヴィヴェク・クリシュナクマール (ヴィヴェククリシュ) | |
張星丹(タンガージャン) | |
ウォン・チョル・イム (wyim-pgl) | |
電子メール | [email protected] |
ライセンス | BSD |
ヒント
JCVI が iMeta に掲載されました!
タンら。 (2024) JCVI: 比較ゲノム解析のための多用途ツールキット。 iメタ
一般的なバイオインフォマティクス処理メソッドとして、次のモジュールが利用可能です。
アルゴリズム
アプリ
フォーマット
現在、 .ace
形式 (phrap、cap3 など)、. .agp
(goldenpath)、. .bed
形式、 .blast
出力、 .btab
形式、 .coords
形式 ( nucmer
出力)、. .fasta
形式、 .fastq
形式、 .fpc
をサポートしています。形式、 .gff
形式、 obo
形式 (オントロジー)、. .psl
形式 (UCSC blat、GMAP など)、. .posmap
形式(Celera アセンブラ出力)、. .sam
形式 (読み取りマッピング)、. .contig
形式 (TIGR アセンブリ形式) など。
グラフィックス
ユーティリティ
次に、ドメイン固有のメソッドを含むモジュールがあります。
組み立て
注釈
比較する
本格的なアプリケーションについては wiki を参照してください。
以下は、ライブラリ内の一部のルーチンで使用されるサードパーティの Python パッケージのリストです。これらの依存関係は少数のモジュールでのみ使用されるため、必須ではありません。
さまざまなスクリプトのあちこちに他の Python モジュールがあります。最善の方法は、 ImportError
が表示されたときにpip install
経由でインストールすることです。
最も簡単な方法は、PyPI 経由でインストールすることです。
pip install jcvi
開発バージョンをインストールするには:
pip install git+git://github.com/tanghaibao/jcvi.git
あるいは、手動でインストールする場合は、次のようにします。
cd ~/code # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .
さらに、拡張プログラムがPATH
で見つからない場合、いくつかのモジュールが外部プログラムの場所を尋ねる場合があります。よく使用される外部プログラムは次のとおりです。
このパッケージ内のほとんどのスクリプトには複数のアクションが含まれています。 fasta
例を使用するには:
Usage:
python -m jcvi.formats.fasta ACTION
Available ACTIONs:
clean | Remove irregular chars in FASTA seqs
diff | Check if two fasta records contain same information
extract | Given fasta file and seq id, retrieve the sequence in fasta format
fastq | Combine fasta and qual to create fastq file
filter | Filter the records by size
format | Trim accession id to the first space or switch id based on 2-column mapping file
fromtab | Convert 2-column sequence file to FASTA format
gaps | Print out a list of gap sizes within sequences
gc | Plot G+C content distribution
identical | Given 2 fasta files, find all exactly identical records
ids | Generate a list of headers
info | Run `sequence_info` on fasta files
ispcr | Reformat paired primers into isPcr query format
join | Concatenate a list of seqs and add gaps in between
longestorf | Find longest orf for CDS fasta
pair | Sort paired reads to .pairs, rest to .fragments
pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
pool | Pool a bunch of fastafiles together and add prefix
qual | Generate dummy .qual file based on FASTA file
random | Randomly take some records
sequin | Generate a gapped fasta file for sequin submission
simulate | Simulate random fasta file for testing
some | Include or exclude a list of records (also performs on .qual file if available)
sort | Sort the records by IDs, sizes, etc.
summary | Report the real no of bases and N's in fasta files
tidy | Normalize gap sizes and remove small components in fasta
translate | Translate CDS to proteins
trim | Given a cross_match screened fasta, trim the sequence
trimsplit | Split sequences at lower-cased letters
uniq | Remove records that are the same
次に、1 つのアクションを使用する必要があります。次のようにするだけです。
python -m jcvi.formats.fasta extract
これにより、予期されるオプションと引数がわかります。
FASTA だけでなく、パッケージ内の他のスクリプトもお気軽にチェックしてください。