jcviダウンロード - jcviソースコードのダウンロード

jcvi

その他のソースコード

ダウンロード

JCVI: 比較ゲノム解析のための多用途ツールキット

バイオインフォマティクスファイルを解析したり、アセンブリ、アノテーション、および比較ゲノミクスに関連する計算を実行したりするための Python ライブラリのコレクション。


著者	海宝堂（タンハイバオ）
	ヴィヴェク・クリシュナクマール (ヴィヴェククリシュ)
	張星丹（タンガージャン）
	ウォン・チョル・イム (wyim-pgl)
電子メール	[email protected]
ライセンス	BSD

引用の仕方

ヒント

JCVI が iMeta に掲載されました!

タンら。 (2024) JCVI: 比較ゲノム解析のための多用途ツールキット。 iメタ

コンテンツ

一般的なバイオインフォマティクス処理メソッドとして、次のモジュールが利用可能です。

アルゴリズム
- SCIP および GLPK を使用した線形計画法ソルバー。
- スーパーマップ: BLAST または NUCMER 出力で重複しないアンカーのセットを検索します。
- 最長または最も重い増加するサブシーケンス。
- 行列演算。
アプリ
- GenBank entrez アクセッション、Phytozome、Ensembl、および SRA ダウンローダー。
- 遺伝子ペア間の（非）同義置換率を計算します。
- PHYLIP、PhyML、または RAxML を使用した基本的な系統樹の構築と視覚化。
- BLAST+、LASTZ、LAST、BWA、BOWTIE2、CLC、CDHIT、CAP3 などのラッパー。
フォーマット
現在、 .ace形式 (phrap、cap3 など)、. .agp (goldenpath)、. .bed形式、 .blast出力、 .btab形式、 .coords形式 ( nucmer出力)、. .fasta形式、 .fastq形式、 .fpcをサポートしています。形式、 .gff形式、 obo形式 (オントロジー)、. .psl形式 (UCSC blat、GMAP など)、. .posmap形式(Celera アセンブラ出力)、. .sam形式 (読み取りマッピング)、. .contig形式 (TIGR アセンブリ形式) など。
グラフィックス
- BLAST またはシンテニードットプロット。
- R と ASCII アートを使用したヒストグラム。
- 染色体のセット上の領域をペイントします。
- マクロシンテニーとマイクロシンテニーのプロット。
ユーティリティ
- Grouper は、素の集合データ構造として使用できます。
- range には、オーバーラップやチェーンなどの一般的な範囲操作が含まれています。
- その他のクックブックレシピ、イテレータデコレータ、テーブルユーティリティ。

次に、ドメイン固有のメソッドを含むモジュールがあります。

組み立て
- K-mer ヒストグラム分析。
- クローンベースのアセンブリのタイルパスの準備と検証。
- ALLMAPS、光学地図、遺伝子地図による足場。
- 組立前および組立後の QC 手順。
注釈
- 非経験的遺伝子予測子のトレーニング。
- 遺伝子、エクソン、イントロンの統計を計算します。
- PASA および EVM のラッパー。
- 複数の MAKER プロセスを起動します。
比較する
- C スコアベースの BLAST フィルター。
- Synteny スキャン (デノボ) とリフトオーバー (近くのアンカーの検索)。
- サンコフ法およびPAR法を使用した祖先ゲノム再構築。
- オーソログおよびタンデム遺伝子重複ファインダー。

アプリケーション

本格的なアプリケーションについては wiki を参照してください。

依存関係

以下は、ライブラリ内の一部のルーチンで使用されるサードパーティの Python パッケージのリストです。これらの依存関係は少数のモジュールによってのみ使用されるため、必須ではありません。

バイオパイソン
しこり
マットプロットライブラリ

さまざまなスクリプトのあちこちに他の Python モジュールがあります。最善の方法は、 ImportErrorが表示されたときにpip install経由でインストールすることです。

インストール

最も簡単な方法は、PyPI 経由でインストールすることです。

 pip install jcvi

開発バージョンをインストールするには:

 pip install git+git://github.com/tanghaibao/jcvi.git

あるいは、手動でインストールする場合は、次のようにします。

 cd ~/code  # or any directory of your choice
git clone git://github.com/tanghaibao/jcvi.git
pip install -e .

さらに、拡張プログラムがPATHで見つからない場合、いくつかのモジュールが外部プログラムの場所を尋ねる場合があります。よく使用される外部プログラムは次のとおりです。

ケントツール
ベッドツール
エンボス

このパッケージ内のほとんどのスクリプトには複数のアクションが含まれています。 fasta例を使用するには:

 Usage:
    python -m jcvi.formats.fasta ACTION


Available ACTIONs:
          clean | Remove irregular chars in FASTA seqs
           diff | Check if two fasta records contain same information
        extract | Given fasta file and seq id, retrieve the sequence in fasta format
          fastq | Combine fasta and qual to create fastq file
         filter | Filter the records by size
         format | Trim accession id to the first space or switch id based on 2-column mapping file
        fromtab | Convert 2-column sequence file to FASTA format
           gaps | Print out a list of gap sizes within sequences
             gc | Plot G+C content distribution
      identical | Given 2 fasta files, find all exactly identical records
            ids | Generate a list of headers
           info | Run `sequence_info` on fasta files
          ispcr | Reformat paired primers into isPcr query format
           join | Concatenate a list of seqs and add gaps in between
     longestorf | Find longest orf for CDS fasta
           pair | Sort paired reads to .pairs, rest to .fragments
    pairinplace | Starting from fragment.fasta, find if adjacent records can form pairs
           pool | Pool a bunch of fastafiles together and add prefix
           qual | Generate dummy .qual file based on FASTA file
         random | Randomly take some records
         sequin | Generate a gapped fasta file for sequin submission
       simulate | Simulate random fasta file for testing
           some | Include or exclude a list of records (also performs on .qual file if available)
           sort | Sort the records by IDs, sizes, etc.
        summary | Report the real no of bases and N's in fasta files
           tidy | Normalize gap sizes and remove small components in fasta
      translate | Translate CDS to proteins
           trim | Given a cross_match screened fasta, trim the sequence
      trimsplit | Split sequences at lower-cased letters
           uniq | Remove records that are the same