ColabFold di PC lokal Anda (atau macOS). Lihat juga repositori ColabFold.
LocalColabFold adalah skrip penginstal yang dirancang untuk membuat fungsionalitas ColabFold tersedia di mesin lokal pengguna. Ini mendukung berbagai sistem operasi, seperti Windows 10 atau lebih baru (menggunakan Subsistem Windows untuk Linux 2), macOS, dan Linux.
Jika Anda hanya ingin memprediksi sejumlah kecil protein alami, saya sarankan menggunakan buku catatan ColabFold atau mengunduh struktur dari AlphaFold Protein Structure Database atau UniProt. LocalColabFold cocok untuk aplikasi tingkat lanjut, seperti pemrosesan batch prediksi struktur untuk kompleks alami, protein non-alami, atau prediksi dengan MSA/templat yang ditentukan secara manual.
Inferensi dan relaksasi struktur akan dipercepat jika PC Anda memiliki GPU Nvidia dan driver CUDA.
No Time out (90 menit 12 jam)
Tidak ada batasan GPU
TIDAK perlu menyiapkan database besar yang diperlukan untuk AlphaFold2 asli .
Karena jax > 0.4.26 yang didukung GPU saat ini memerlukan CUDA 12.1 atau lebih baru dan cudnn 9, harap tingkatkan atau instal driver CUDA dan cudnn Anda. CUDA 12.4 direkomendasikan.
ColabFold sekarang ditingkatkan ke 1.5.5 (kompatibel dengan AlphaFold 2.3.2). Sekarang LocalColabFold memerlukan CUDA 12.1 atau lebih baru . Harap perbarui driver CUDA Anda jika Anda belum melakukannya.
Sekarang (Lokal)ColabFold dapat memprediksi struktur protein tanpa menghubungkan Internet. Gunakan skrip setup_databases.sh
untuk mengunduh dan membangun database (Lihat juga Unduhan ColabFold). Instruksi untuk menjalankan colabfold_search
untuk mendapatkan MSA dan template secara lokal ditulis dalam komentar ini.
30Jan2024, ColabFold 1.5.5 (Kompatibel dengan AlphaFold 2.3.2). Sekarang LocalColabFold memerlukan CUDA 12.1 atau lebih baru . Harap perbarui driver CUDA Anda.
30Apr2023, Diperbarui untuk menggunakan python 3.10 untuk kompatibilitas dengan Google Colaboratory.
09Mar2023, versi 1.5.1 dirilis. Direktori dasar telah diubah menjadi localcolabfold
dari colabfold_batch
untuk membedakannya dari perintah eksekusi.
09Mar2023, versi 1.5.0 dirilis. Lihat Rilis v1.5.0
05Feb2023, versi 1.5.0-pra dirilis.
16Jun2022, versi 1.4.0 dirilis. Lihat Rilis v1.4.0
07Mei2022, Diperbarui update_linux.sh
. Lihat juga Cara memperbarui. Silakan gunakan opsi baru --use-gpu-relax
jika relaksasi GPU diperlukan (disarankan).
12Apr2022, versi 1.3.0 dirilis. Lihat Rilis v1.3.0
09Des2021, versi 1.2.0-beta dirilis. skrip pembaru yang mudah digunakan ditambahkan. Lihat Cara memperbarui.
04Des2021, LocalColabFold kini kompatibel dengan ColabFold pip terbaru yang dapat diinstal. Pada repositori ini saya akan memberikan script untuk menginstal ColabFold dengan beberapa file parameter eksternal untuk melakukan relaksasi dengan AMBER. Parameter bobot AlphaFold dan AlphaFold-Multimer akan diunduh secara otomatis saat Anda pertama kali menjalankannya.
Pastikan perintah curl
, git
, dan wget
sudah terinstal di PC Anda. Jika tidak ada, Anda perlu menginstalnya terlebih dahulu. Untuk Ubuntu, ketik sudo apt -y install curl git wget
.
Pastikan driver kompiler Cuda Anda adalah 11.8 atau lebih baru (lebih disukai versi terbaru 12.4). Jika Anda tidak memiliki GPU atau tidak berencana menggunakan GPU, Anda dapat melewati langkah ini :
$ nvcc --versi nvcc: driver kompiler NVIDIA (R) Cuda Hak Cipta (c) 2005-2022 NVIDIA Corporation Dibangun pada Rabu_21_Sep_10:33:58_PDT_2022 Alat kompilasi Cuda, rilis 11.8, V11.8.89 Bangun cuda_11.8.r11.8/compiler.31833905_0
JANGAN gunakan nvidia-smi
untuk memeriksa versinya.
Lihat Panduan Instalasi NVIDIA CUDA untuk Linux jika Anda belum menginstalnya.
Pastikan versi kompiler GNU Anda adalah 9.0 atau lebih baru karena GLIBCXX_3.4.26
diperlukan untuk openmm:
$gcc --versi gcc (Ubuntu 9.3.0-17ubuntu1~20.04) 9.3.0 Hak Cipta (C) 2019 Free Software Foundation, Inc. Ini adalah perangkat lunak gratis; lihat sumber untuk kondisi penyalinan. TIDAK ada jaminan; bahkan bukan untuk KELAYAKAN UNTUK DIPERDAGANGKAN atau KESESUAIAN UNTUK TUJUAN TERTENTU.
Jika versinya 8.5.0 atau lebih lama (misalnya CentOS 7, Rocky/Almalinux 8, dll.), instal yang baru dan tambahkan PATH
ke dalamnya.
Unduh install_colabbatch_linux.sh
dari repositori ini:
$ wget https://raw.githubusercontent.com/YoshitakaMo/localcolabfold/main/install_colabbatch_linux.sh
dan jalankan di direktori tempat Anda ingin menginstal:
$ pesta install_colabbatch_linux.sh
Sekitar 5 menit kemudian, direktori localcolabfold
akan dibuat. Jangan pindahkan direktori ini setelah instalasi.
Biarkan jaringan tidak diblokir. Dan periksa keluaran log untuk melihat apakah ada kesalahan.
Jika Anda menemukan kesalahan pada log keluaran, cara termudah adalah dengan memeriksa jaringan dan menghapus direktori localcolabfold, lalu menjalankan kembali skrip instalasi.
Tambahkan variabel lingkungan PATH:
# Untuk bash atau zsh # misalnya ekspor PATH="/home/moriwaki/Desktop/localcolabfold/colabfold-conda/bin:$PATH" ekspor PATH="/path/ke/Anda/localcolabfold/colabfold-conda/bin:$PATH"
Disarankan untuk menambahkan perintah ekspor ini ke ~/.bashrc
dan memulai ulang bash ( ~/.bashrc
akan dieksekusi setiap kali bash dimulai)
Untuk menjalankan prediksi, ketik
colabfold_batch masukan keluarandir/
File hasil akan dibuat di outputdir
. Perintah ini akan menjalankan prediksi tanpa template dan relaksasi (minimalkan energi). Jika Anda ingin menggunakan template dan relaksasi, tambahkan flag --templates
dan --amber
masing-masing. Misalnya,
colabfold_batch --template --amber masukan keluarandir/
colabfold_batch
akan secara otomatis mendeteksi apakah prediksi tersebut untuk prediksi monomer atau kompleks. Dalam kebanyakan kasus, pengguna tidak perlu menambahkan --model-type alphafold2_multimer_v3
untuk mengaktifkan prediksi multimer. alphafold2_multimer_v1, alphafold2_multimer_v2
juga tersedia. Standarnya adalah auto
(gunakan alphafold2_ptm
untuk monomer dan alphafold2_multimer_v3
untuk kompleks.)
Untuk detail selengkapnya, lihat Bendera dan colabfold_batch --help
.
Perhatian: Jika instalasi Anda gagal karena masalah pembuatan tautan simbolik ( symlink
), hal ini disebabkan sistem file Windows tidak peka huruf besar-kecil (sedangkan sistem file Linux peka huruf besar-kecil). Untuk mengatasinya, jalankan perintah berikut di Windows Powershell:
fsutil file SetCaseSensitiveInfo pathtolocalcolabfoldinstallation enable
Ganti pathtocolabfoldinstallation
dengan path ke direktori tempat Anda menginstal LocalColabFold. Selain itu, pastikan Anda menjalankan perintah di Windows Powershell (bukan WSL). Untuk detail selengkapnya, lihat Menyesuaikan Sensitivitas Huruf Besar (Microsoft).
Sebelum menjalankan prediksi:
export TF_FORCE_UNIFIED_MEMORY="1" export XLA_PYTHON_CLIENT_MEM_FRACTION="4.0" export XLA_PYTHON_CLIENT_ALLOCATOR="platform" export TF_FORCE_GPU_ALLOW_GROWTH="true"
Disarankan untuk menambahkan perintah ekspor ini ke ~/.bashrc
dan memulai ulang bash ( ~/.bashrc
akan dieksekusi setiap kali bash dimulai)
Perhatian: Karena kurangnya driver GPU/CUDA Nvidia, prediksi struktur di macOS 5-10 kali lebih lambat dibandingkan di Linux+GPU . Untuk rangkaian pengujian (58 aa), mungkin memerlukan waktu 30 menit. Namun, mungkin berguna untuk memainkannya sebelum menyiapkan lingkungan Linux+GPU.
Anda dapat memeriksa apakah Mac Anda Intel atau Apple Silicon dengan mengetik uname -m
di Terminal.
$ satu nama -m x86_64 # Intelarm64 # Apple Silicon
Silakan gunakan penginstal yang benar untuk Mac Anda.
Instal Homebrew jika tidak ada:
$ /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
Instal wget
, gnu-sed
, HH-suite dan kalign menggunakan Homebrew:
$ brew install wget gnu-sed $ minuman instal brewsci/bio/hh-suite brewsci/bio/kalign
Unduh install_colabbatch_intelmac.sh
dari repositori ini:
$ wget https://raw.githubusercontent.com/YoshitakaMo/localcolabfold/main/install_colabbatch_intelmac.sh
dan jalankan di direktori tempat Anda ingin menginstal:
$ pesta install_colabbatch_intelmac.sh
Sekitar 5 menit kemudian, direktori colabfold_batch
akan dibuat. Jangan pindahkan direktori ini setelah instalasi.
Prosedur selanjutnya sama dengan "Untuk Linux".
Catatan: Penginstal ini bersifat eksperimental karena sebagian besar paket dependen belum sepenuhnya diuji pada Apple Silicon Mac.
Instal Homebrew jika tidak ada:
$ /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
Instal beberapa perintah menggunakan Homebrew (Sekarang kalign 3.3.2 tersedia!):
$ brew install wget cmake gnu-sed $ minuman instal brewsci/bio/hh-suite $ minuman instal brewsci/bio/kalign
Instal perintah miniforge
menggunakan Homebrew:
$ pembuatan bir instal --tong miniforge
Unduh install_colabbatch_M1mac.sh
dari repositori ini:
$ wget https://raw.githubusercontent.com/YoshitakaMo/localcolabfold/main/install_colabbatch_M1mac.sh
dan jalankan di direktori tempat Anda ingin menginstal:
$ pesta install_colabbatch_M1mac.sh
Sekitar 5 menit kemudian, direktori colabfold_batch
akan dibuat. Jangan pindahkan direktori ini setelah instalasi. Anda dapat mengabaikan kesalahan instalasi yang muncul di sepanjang jalan .
Prosedur selanjutnya sama dengan "Untuk Linux".
ColabFold dapat menerima berbagai format file atau direktori.
positional arguments: input Can be one of the following: Directory with fasta/a3m files, a csv/tsv file, a fasta file or an a3m file results Directory to write the results to
Disarankan agar baris header yang dimulai dengan >
pendek karena deskripsi akan menjadi awalan file keluaran. Penyisipan jeda baris pada urutan asam amino dapat diterima.
>sp|P61823
MALKSLVLLSLLVLVLLLVRVQPSLGKETAAAKFERQHMDSSTSAASSSNYCNQMMKSRN
LTKDRCKPVNTFVHESLADVQAVCSQKNVACKNGQTNCYQSYSTMSITDCRETGSSKYPN
CAYKTTQANKHIIVACEGNPYVPVHFDASV
Untuk prediksi multimer, masukkan :
di antara rangkaian protein.
>1BJP_homohexamer PIAQIHILEGRSDEQKETLIREVSEAISRSLDAPLTSVRVIITEMAKGHFGIGGELASKVRR: PIAQIHILEGRSDEQKETLIREVSEAISRSLDAPLTSVRVIITEMAKGHFGIGGELASKVRR: PIAQIHILEGRSDEQKETLIREVSEAISRSLDAPLTSVRVIITEMAKGHFGIGGELASKVRR: PIAQIHILEGRSDEQKETLIREVSEAISRSLDAPLTSVRVIITEMAKGHFGIGGELASKVRR: PIAQIHILEGRSDEQKETLIREVSEAISRSLDAPLTSVRVIITEMAKGHFGIGGELASKVRR: PIAQIHILEGRSDEQKETLIREVSEAISRSLDAPLTSVRVIITEMAKGHFGIGGELASKVRR
>3KUD_RasRaf_complex MTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGETCLLDILDTAGQEEYSAMRDQ YMRTGEGFLCVFAINNTKSFEDIHQYREQIKRVKDSDDVPMVLVGNKCDLAARTVESRQAQDLARSYGIP YIETSAKTRQGVEDAFYTLVREIRQH: PSKTSNTIRVFLPNKQRTVVNVRNGMSLHDCLMKALKVRGLQPECCAVFRLLHEHKGKKARLDWNTDAAS LIGEELQVDFL
Beberapa baris header >
dengan urutan dalam file format FASTA menghasilkan beberapa prediksi sekaligus di direktori output yang ditentukan.
Dalam format csv, id
dan sequence
harus dipisahkan dengan ,
.
id,sequence
5AWL_1,YYDPETGTWY
3G5O_A_3G5O_B,MRILPISTIKGKLNEFVDAVSSTQDQITITKNGAPAAVLVGADEWESLQETLYWLAQPGIRESIAEADADIASGRTYGEDEIRAEFGVPRRPH:MPYTVRFTTTARRDLHKLPPRILAAVVEFAFGDLSREPLRVGKPLRRELAGTFSARRGTYRLLYRIDDEHTTVVILRVDHRADIYRR
Anda dapat memasukkan file MSA format a3m Anda. Untuk prediksi multimer, file a3m harus kompatibel dengan format colabfold.
Bendera ini berguna untuk prediksi.
--amber
: Gunakan amber untuk penyempurnaan struktur (relaksasi / minimalisasi energi). Untuk mengontrol jumlah struktur peringkat teratas adalah set santai --num-relax
.
--templates
: Gunakan templat dari pdb.
--use-gpu-relax
: Jalankan warna kuning pada GPU NVidia, bukan pada CPU. Fitur ini hanya tersedia pada mesin dengan GPU Nvidia.
--num-recycle
: Jumlah prediksi yang didaur ulang. Meningkatkan daur ulang dapat meningkatkan kualitas namun memperlambat prediksi. Standarnya adalah 3
. (misalnya --num-recycle 10
)
--custom-template-path
: Membatasi file template yang digunakan untuk --template
hanya yang terdapat dalam direktori yang ditentukan. Tanda ini memungkinkan kita menggunakan file pdb non-publik untuk prediksi. Lihat juga sokrypton/ColabFold#177 .
--random-seed
Mengubah seed untuk penghasil angka acak dapat menghasilkan prediksi struktur yang berbeda. (misalnya --random-seed 42
)
--num-seeds
Jumlah benih yang akan dicoba. Akan mengulangi dari rentang (random_seed, random_seed+num_seeds). (misalnya --num-seed 5
)
--max-msa
: Mendefinisikan: max-seq:max-extra-seq
jumlah urutan yang akan digunakan (misalnya --max-msa 512:1024
). Argumen --max-seq
dan --max-extra-seq
juga tersedia jika Anda ingin menentukannya secara terpisah. Ini adalah implementasi ulang makalah Pengambilan sampel keadaan konformasi alternatif transporter dan reseptor dengan AlphaFold2 yang ditunjukkan oleh del Alamo dkk .
--use-dropout
: mengaktifkan dropout selama inferensi untuk mengambil sampel dari ketidakpastian model.
--overwrite-existing-results
: Menimpa file hasil.
Untuk informasi lebih lanjut, colabfold_batch --help
.
Karena ColabFold masih dalam proses,colabfold lokal Anda juga harus sering diperbarui untuk menggunakan fitur terbaru. Skrip pembaruan yang mudah digunakan disediakan untuk tujuan ini.
Untuk memperbarui localcolabfold Anda, cukup jalankan perintah berikut:
# atur OS Anda. Pilih salah satu variabel berikut {linux,intelmac,M1mac}$ OS=linux # jika Linux# arahkan ke direktori tempat Anda menginstal localcolabfold, misal$ cd /home/moriwaki/Desktop/localcolabfold/# dapatkan updater terbaru$ wget https ://raw.githubusercontent.com/YoshitakaMo/localcolabfold/main/update_${OS}.sh -O update_${OS}.sh $ chmod +x update_${OS}.sh# jalankan.$ ./update_${OS}.sh .
Apa lagi yang perlu saya lakukan sebelum instalasi? Apakah saya memerlukan hak istimewa Sudo?
Tidak, kecuali untuk instalasi perintah curl
dan wget
.
Apakah saya perlu menyiapkan database besar seperti PDB70, BFD, Uniclust30, MGnify?
Tidak, itu tidak perlu. Pembuatan MSA dilakukan oleh server web MMseqs2, seperti yang diterapkan di ColabFold.
Apakah skor pLDDT dan angka PAE tersedia?
Ya, mereka akan dibuat seperti ColabFold.
Apakah mungkin untuk memprediksi homooligomer dan kompleks?
Ya, format urutan masukannya sama dengan ColabFold. Lihat query_sequence:
dan penggunaannya ColabFold: AlphaFold2 menggunakan MMseqs2.
Apakah mungkin membuat MSA dengan jackhmmer?
Tidak, saat ini tidak didukung .
Saya ingin menggunakan banyak GPU untuk melakukan prediksi.
AlphaFold dan ColabFold tidak mendukung banyak GPU . Hanya Satu GPU yang dapat memodelkan protein Anda.
Saya memiliki banyak GPU. Bisakah saya menentukan untuk menjalankan LocalColabfold di setiap GPU?
Gunakan variabel lingkungan CUDA_VISIBLE_DEVICES
. Lihat #200.
Saya mendapat pesan kesalahan CUDA_ERROR_ILLEGAL_ADDRESS: an illegal memory access was encountered
.
Anda mungkin belum memperbarui ke CUDA 11.8 atau lebih baru. Silakan periksa versi kompiler Cuda dengan perintah nvcc --version
, bukan nvidia-smi
.
Apakah ini tersedia di Windows 10?
Anda dapat menjalankan LocalColabFold di Windows 10 Anda dengan WSL2.
(Baru!) Saya ingin menggunakan file MSA khusus dalam format a3m.
ColabFold sekarang dapat menerima berbagai file masukan . Lihat pesan bantuan. Anda dapat mengatur file A3M Anda sendiri, file fasta yang berisi banyak urutan (dalam format FASTA), atau direktori yang berisi banyak file fasta.
Tutorial ColabFold dipresentasikan di Boston Protein Design and Modeling Club. [video] [slide].
Colabfold asli pertama kali dibuat oleh Sergey Ovchinnikov (@sokrypton), Milot Mirdita (@milot_mirdita) dan Martin Steinegger (@thesteinegger).
Mirdita M, Schütze K, Moriwaki Y, Heo L, Ovchinnikov S dan Steinegger M. ColabFold - Membuat pelipatan protein dapat diakses oleh semua orang.
Metode Alam (2022) doi: 10.1038/s41592-022-01488-1
Jika Anda menggunakan AlphaFold , harap kutip juga:
Pelompat dkk. "Prediksi struktur protein yang sangat akurat dengan AlphaFold."
Alam (2021) doi: 10.1038/s41586-021-03819-2
Jika Anda menggunakan AlphaFold-multimer , harap kutip juga:
Evans dkk. "Prediksi protein kompleks dengan AlphaFold-Multimer."
BioRxiv (2022) doi: 10.1101/2021.10.04.463034v2