ローカル PC (または macOS) 上の ColabFold。 ColabFold リポジトリも参照してください。
LocalColabFold は、ColabFold 機能をユーザーのローカル マシンで利用できるようにするために設計されたインストーラー スクリプトです。 Windows 10 以降 (Windows Subsystem for Linux 2 を使用)、macOS、Linux など、幅広いオペレーティング システムをサポートしています。
少数の天然タンパク質のみを予測する場合は、ColabFold ノートブックを使用するか、AlphaFold タンパク質構造データベースまたは UniProt から構造をダウンロードすることをお勧めします。 LocalColabFold は、天然複合体、非天然タンパク質の構造予測のバッチ処理、または手動で指定された MSA/テンプレートを使用した予測など、より高度なアプリケーションに適しています。
PC に Nvidia GPU および CUDA ドライバーが搭載されている場合、構造の推論と緩和が高速化されます。
タイムアウトなし(90分と12時間)
GPU制限なし
ネイティブ AlphaFold2 に必要な大規模なデータベースを準備する必要はありません。
現在 GPU でサポートされている jax > 0.4.26 には CUDA 12.1 以降と cudnn 9 が必要なため、CUDA ドライバーと cudnn をアップグレードまたはインストールしてください。 CUDA12.4を推奨します。
ColabFold は 1.5.5 にアップグレードされます (AlphaFold 2.3.2 と互換性があります)。現在、LocalColabFold にはCUDA 12.1 以降が必要です。 CUDA ドライバーをまだ更新していない場合は、更新してください。
(ローカル)ColabFold は、インターネットに接続せずにタンパク質の構造を予測できるようになりました。 setup_databases.sh
スクリプトを使用して、データベースをダウンロードして構築します (ColabFold のダウンロードも参照)。 colabfold_search
実行して MSA とテンプレートをローカルで取得する手順がこのコメントに書かれています。
2024 年 1 月 30 日、ColabFold 1.5.5 (AlphaFold 2.3.2 と互換性あり)。現在、LocalColabFold にはCUDA 12.1 以降が必要です。 CUDA ドライバーを更新してください。
2023 年 4 月 30 日、Google Colaboratory との互換性のために Python 3.10 を使用するように更新されました。
2023 年 3 月 9 日、バージョン 1.5.1 がリリースされました。実行コマンドと区別するために、ベースディレクトリがcolabfold_batch
からlocalcolabfold
に変更されました。
2023 年 3 月 9 日、バージョン 1.5.0 がリリースされました。リリース v1.5.0 を参照してください。
2023 年 2 月 5 日、バージョン 1.5.0 プレリリース。
2022 年 6 月 16 日、バージョン 1.4.0 がリリースされました。リリース v1.4.0 を参照してください。
2022 年 5 月 7 日、 update_linux.sh
を更新しました。アップデート方法も参照してください。 GPU 緩和が必要な場合は、新しいオプション--use-gpu-relax
を使用してください (推奨)。
2022 年 4 月 12 日、バージョン 1.3.0 がリリースされました。リリース v1.3.0 を参照してください。
2021 年 12 月 9 日、バージョン 1.2.0 ベータ版がリリースされました。使いやすいアップデータ スクリプトが追加されました。アップデート方法を参照してください。
2021 年 12 月 4 日、LocalColabFold は、最新の pip インストール可能な ColabFold と互換性を持つようになりました。このリポジトリでは、AMBER で緩和を実行するために、いくつかの外部パラメータ ファイルを使用して ColabFold をインストールするスクリプトを提供します。 AlphaFold および AlphaFold-Multimer の重量パラメーターは、最初の実行時に自動的にダウンロードされます。
curl
、 git
、およびwget
コマンドがすでに PC にインストールされていることを確認してください。存在しない場合は、最初にインストールする必要があります。 Ubuntu の場合は、 sudo apt -y install curl git wget
と入力します。
Cuda コンパイラ ドライバが11.8 以降であることを確認してください (最新バージョン 12.4 が推奨されます)。 GPU がない場合、または GPU を使用する予定がない場合は、この手順をスキップできます。
$ nvcc --バージョン nvcc: NVIDIA(R) Cuda コンパイラードライバー 著作権 (c) 2005-2022 NVIDIA Corporation 2022 年 9 月 21 日水曜日 10:33:58PDT に構築 Cuda コンパイル ツール、リリース 11.8、V11.8.89 cuda_11.8.r11.8/compiler.31833905_0 をビルドします。
バージョンを確認するためにnvidia-smi
使用しないでください。
まだインストールしていない場合は、「Linux 用 NVIDIA CUDA インストール ガイド」を参照してください。
openmm にはGLIBCXX_3.4.26
が必要であるため、GNU コンパイラのバージョンが9.0 以降であることを確認してください。
$ gcc --バージョン gcc (Ubuntu 9.3.0-17ubuntu1~20.04) 9.3.0 Copyright (C) 2019 Free Software Foundation, Inc. これは無料ソフトウェアです。コピー条件についてはソースを参照してください。 いいえ 保証;商業性や特定の目的への適合性のためでもありません。
バージョンが 8.5.0 以前の場合 (CentOS 7、Rocky/Almalinux 8 など)、新しいバージョンをインストールし、それにPATH
追加します。
このリポジトリからinstall_colabbatch_linux.sh
をダウンロードします。
$ wget https://raw.githubusercontent.com/YoshitakaMo/localcolabfold/main/install_colabbatch_linux.sh
そして、インストールするディレクトリで実行します。
$ bash install_colabbatch_linux.sh
5分ほどするとlocalcolabfold
ディレクトリが作成されます。インストール後にこのディレクトリを移動しないでください。
ネットワークをブロックしないようにしてください。そして、ログ出力をチェックして、エラーがないかどうかを確認します。
出力ログにエラーが見つかった場合、最も簡単な方法は、ネットワークをチェックして localcolabfold ディレクトリを削除し、インストール スクリプトを再実行することです。
環境変数 PATH を追加します。
# bash または zsh の場合 # 例: import PATH="/home/moriwake/Desktop/localcolabfold/colabfold-conda/bin:$PATH" エクスポート PATH="/path/to/your/localcolabfold/colabfold-conda/bin:$PATH"
このエクスポート コマンドを~/.bashrc
に追加して bash を再起動することをお勧めします ( ~/.bashrc
bash が起動されるたびに実行されます)。
予測を実行するには、次のように入力します。
colabfold_batch 入力出力ディレクトリ/
結果ファイルはoutputdir
に作成されます。このコマンドは、テンプレートと緩和 (エネルギー最小化) を使用せずに予測を実行します。テンプレートとリラクゼーションを使用する場合は、それぞれ--templates
フラグと--amber
フラグを追加します。例えば、
colabfold_batch --templates --amber 入力出力ディレクトリ/
colabfold_batch
予測が単量体予測であるか複合予測であるかを自動的に検出します。ほとんどの場合、ユーザーはマルチマー予測を有効にするために--model-type alphafold2_multimer_v3
を追加する必要はありません。 alphafold2_multimer_v1, alphafold2_multimer_v2
も利用できます。デフォルトはauto
です (モノマーにはalphafold2_ptm
、複合体にはalphafold2_multimer_v3
を使用します)。
詳細については、「フラグ」とcolabfold_batch --help
を参照してください。
注意: シンボリック リンク ( symlink
) 作成の問題によりインストールが失敗する場合、Windows ファイル システムでは大文字と小文字が区別されないことが原因です (Linux ファイル システムでは大文字と小文字が区別されます)。これを解決するには、Windows Powershell で次のコマンドを実行します。
fsutil file SetCaseSensitiveInfo pathtolocalcolabfoldinstallation enable
pathtocolabfoldinstallation
LocalColabFold をインストールするディレクトリへのパスに置き換えます。また、(WSL ではなく) Windows Powershell でコマンドを実行していることを確認してください。詳細については、「大文字と小文字の区別の調整 (Microsoft)」を参照してください。
予測を実行する前に:
export TF_FORCE_UNIFIED_MEMORY="1" export XLA_PYTHON_CLIENT_MEM_FRACTION="4.0" export XLA_PYTHON_CLIENT_ALLOCATOR="platform" export TF_FORCE_GPU_ALLOW_GROWTH="true"
これらのエクスポート コマンドを~/.bashrc
に追加して bash を再起動することをお勧めします ( ~/.bashrc
bash が起動されるたびに実行されます)。
注意: Nvidia GPU/CUDA ドライバーがないため、macOS での構造予測は Linux+GPU よりも 5 ~ 10 倍遅くなります。テストシーケンス (58 aa) の場合、30 分かかる場合があります。ただし、Linux+GPU 環境を準備する前に試してみると便利かもしれません。
ターミナルでuname -m
と入力すると、Mac が Intel か Apple Silicon かを確認できます。
$ uname -m x86_64 # Intelarm64 # Apple Silicon
お使いの Mac に適したインストーラーを使用してください。
Homebrew が存在しない場合はインストールします。
$ /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
Homebrew を使用してwget
、 gnu-sed
、 HH-suite 、および kalign をインストールします。
$ brew install wget gnu-sed $ brew install brewsci/bio/hh-suite brewsci/bio/kalign
このリポジトリからinstall_colabbatch_intelmac.sh
をダウンロードします。
$ wget https://raw.githubusercontent.com/YoshitakaMo/localcolabfold/main/install_colabbatch_intelmac.sh
そして、インストールするディレクトリで実行します。
$ bash install_colabbatch_intelmac.sh
5分ほどするとcolabfold_batch
ディレクトリが作成されます。インストール後にこのディレクトリを移動しないでください。
以降の手順は「Linuxの場合」と同様です。
注: 依存パッケージのほとんどは Apple Silicon Mac では完全にテストされていないため、このインストーラーは実験的なものです。
Homebrew が存在しない場合はインストールします。
$ /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
Homebrew を使用していくつかのコマンドをインストールします (kalign 3.3.2 が利用可能になりました!):
$ brew install wget cmake gnu-sed $ brew install brewsci/bio/hh-suite $ brew インストール brewsci/bio/kalign
Homebrew を使用してminiforge
コマンドをインストールします。
$ brew install --cask miniforge
このリポジトリからinstall_colabbatch_M1mac.sh
をダウンロードします。
$ wget https://raw.githubusercontent.com/YoshitakaMo/localcolabfold/main/install_colabbatch_M1mac.sh
そして、インストールするディレクトリで実行します。
$ bash install_colabbatch_M1mac.sh
5分ほどするとcolabfold_batch
ディレクトリが作成されます。インストール後にこのディレクトリを移動しないでください。途中で表示されるインストール エラーは無視してかまいません。
以降の手順は「Linuxの場合」と同様です。
ColabFold は複数のファイル形式またはディレクトリを受け入れることができます。
positional arguments: input Can be one of the following: Directory with fasta/a3m files, a csv/tsv file, a fasta file or an a3m file results Directory to write the results to
>
で始まるヘッダー行は、説明が出力ファイルのプレフィックスとなるため、短くすることをお勧めします。アミノ酸配列中に改行を入れても構いません。
>sp|P61823
MALKSLVLLSLLVLVLLLVRVQPSLGKETAAAKFERQHMDSSTSAASSSNYCNQMMKSRN
LTKDRCKPVNTFVHESLADVQAVCSQKNVACKNGQTNCYQSYSTMSITDCRETGSSKYPN
CAYKTTQANKHIIVACEGNPYVPVHFDASV
マルチマーを予測するには、タンパク質配列の間に:
を挿入します。
>1BJP_homohexamer PIAQIHILEGRSDEQKETLIREVSEAISRSLDAPLTSVRVIITEMAKGHFGIGGELASKVRR: PIAQIHILEGRSDEQKETLIREVSEAISRSLDAPLTSVRVIITEMAKGHFGIGGELASKVRR: PIAQIHILEGRSDEQKETLIREVSEAISRSLDAPLTSVRVIITEMAKGHFGIGGELASKVRR: PIAQIHILEGRSDEQKETLIREVSEAISRSLDAPLTSVRVIITEMAKGHFGIGGELASKVRR: PIAQIHILEGRSDEQKETLIREVSEAISRSLDAPLTSVRVIITEMAKGHFGIGGELASKVRR: PIAQIHILEGRSDEQKETLIREVSEAISRSLDAPLTSVRVIITEMAKGHFGIGGELASKVRR
>3KUD_RasRaf_complex MTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGETCLLDILDTAGQEEYSAMRDQ YMRTGEGFLCVFAINNTKSFEDIHQYREQIKRVKDSDDVPMVLVGNKCDLAARTVESRQAQDLARSYGIP YIETSAKTRQGVEDAFYTLVREIRQH: PSKTSNTIRVFLPNKQRTVVNVRNGMSLHDCLMKALKVRGLQPECCAVFRLLHEHKGKKARLDWNTDAAS LIGEELQVDFL
FASTA 形式ファイル内のシーケンスを含む複数の>
ヘッダー行は、指定された出力ディレクトリに複数の予測を一度に生成します。
CSV 形式では、 id
とsequence
,
で区切る必要があります。
id,sequence
5AWL_1,YYDPETGTWY
3G5O_A_3G5O_B,MRILPISTIKGKLNEFVDAVSSTQDQITITKNGAPAAVLVGADEWESLQETLYWLAQPGIRESIAEADADIASGRTYGEDEIRAEFGVPRRPH:MPYTVRFTTTARRDLHKLPPRILAAVVEFAFGDLSREPLRVGKPLRRELAGTFSARRGTYRLLYRIDDEHTTVVILRVDHRADIYRR
a3m形式のMSAファイルを入力できます。マルチマー予測の場合、a3m ファイルは colabfold 形式と互換性がある必要があります。
これらのフラグは予測に役立ちます。
--amber
: 構造の改善 (緩和/エネルギーの最小化) にアンバーを使用します。緩和される上位ランクの構造体の数を制御するには、 --num-relax
を設定します。
--templates
: pdb のテンプレートを使用します。
--use-gpu-relax
: CPU ではなく NVidia GPU でアンバーを実行します。この機能は、Nvidia GPU を搭載したマシンでのみ使用できます。
--num-recycle
: 予測リサイクルの数。リサイクルを増やすと品質は向上しますが、予測は遅くなります。デフォルトは3
です。 (例: --num-recycle 10
)
--custom-template-path
: --template
で使用されるテンプレート ファイルを、指定されたディレクトリに含まれるファイルのみに制限します。このフラグにより、予測に非公開の pdb ファイルを使用できるようになります。 sokrypton/ColabFold#177 も参照してください。
--random-seed
乱数ジェネレーターのシードを変更すると、異なる構造予測が生じる可能性があります。 (例: --random-seed 42
)
--num-seeds
試行するシードの数。 range(random_seed, random_seed+num_seeds) から反復されます。 (例: --num-seed 5
)
--max-msa
: 定義: max-seq:max-extra-seq
使用するシーケンスの数 (例: --max-msa 512:1024
)。個別に指定する場合は、 --max-seq
および--max-extra-seq
引数も使用できます。これは、del Alamoらによって実証された AlphaFold2 を使用したトランスポーターと受容体の代替立体構造状態のサンプリングに関する論文を再実装したものです。
--use-dropout
: 推論中にドロップアウトをアクティブにして、モデルの不確実性からサンプリングします。
--overwrite-existing-results
: 結果ファイルを上書きします。
詳細については、 colabfold_batch --help
ください。
ColabFold はまだ開発中であるため、最新の機能を使用するには、localcolabfold も頻繁に更新する必要があります。この目的のために、使いやすい更新スクリプトが提供されています。
localcolabfold を更新するには、次のコマンドを実行するだけです。
# OSを設定します。次の変数のいずれかを選択します {linux,intelmac,M1mac}$ OS=linux # Linux の場合# localcolabfold をインストールしたディレクトリに移動します。例: $ cd /home/moriwake/Desktop/localcolabfold/# 最新のアップデータを取得します$ wget https ://raw.githubusercontent.com/YoshitakaMo/localcolabfold/main/update_${OS}.sh -O update_${OS}.sh $ chmod +x update_${OS}.sh# 実行します。$ ./update_${OS}.sh 。
インストール前に他に何をする必要がありますか? sudo 権限が必要ですか?
いいえ、 curl
およびwget
コマンドのインストールを除きます。
PDB70、BFD、Uniclust30、MGnifyなどの大規模なデータベースを準備する必要がありますか?
いいえ、その必要はありません。 MSA の生成は、ColabFold で実装されているのと同じように、MMseqs2 Web サーバーによって実行されます。
pLDDT スコアと PAE の数値は入手可能ですか?
はい、ColabFold と同じように生成されます。
ホモオリゴマーと複合体を予測することは可能ですか?
はい、入力シーケンスの形式は ColabFold と同じです。 query_sequence:
と ColabFold の使用法: MMseqs2 を使用した AlphaFold2 を参照してください。
jackhmmer で MSA を作成することはできますか?
いいえ、現在サポートされていません。
複数の GPU を使用して予測を実行したいと考えています。
AlphaFold と ColabFold は複数の GPU をサポートしていません。タンパク質をモデル化できる GPU は 1 つだけです。
複数の GPU を持っています。各 GPU で LocalColabfold を実行するように指定できますか?
CUDA_VISIBLE_DEVICES
環境変数を使用します。 #200を参照してください。
エラー メッセージCUDA_ERROR_ILLEGAL_ADDRESS: an illegal memory access was encountered
が表示されました。
CUDA 11.8 以降に更新されていない可能性があります。 Cuda コンパイラのバージョンは、 nvidia-smi
ではなくnvcc --version
コマンドで確認してください。
これは Windows 10 でも利用できますか?
WSL2 を使用して Windows 10 で LocalColabFold を実行できます。
(New!)a3m 形式のカスタム MSA ファイルを使用したいと考えています。
ColabFold はさまざまな入力ファイルを受け入れることができるようになりました。ヘルプメッセージを参照してください。独自の A3M ファイル、複数のシーケンス (FASTA 形式) を含む fasta ファイル、または複数の fasta ファイルを含むディレクトリを設定できます。
ColabFold チュートリアルはボストン プロテイン デザイン アンド モデリング クラブで発表されました。 [ビデオ] [スライド]。
オリジナルの colabfold は、Sergey Ovchinnikov (@sokrypton)、Milot Mirdita (@milot_mirdita)、Martin Steinegger (@thesteinegger) によって最初に作成されました。
Mirdita M、Schütze K、Morikawa Y、Heo L、Ovchinnikov S、Steinegger M. ColabFold - タンパク質のフォールディングを誰でも利用できるようにします。
ネイチャーメソッド(2022) doi: 10.1038/s41592-022-01488-1
AlphaFold を使用している場合は、以下も引用してください。
ジャンパーら「AlphaFold による高精度なタンパク質構造予測」
自然(2021) 土井: 10.1038/s41586-021-03819-2
AlphaFold-multimer を使用している場合は、以下も引用してください。
エヴァンスら。 「AlphaFold-Multimer によるタンパク質複合体の予測」
BioRxiv (2022) doi: 10.1101/2021.10.04.463034v2