AI-ผูก
AI-Bind เป็นไปป์ไลน์การเรียนรู้เชิงลึกที่ให้การคาดการณ์การเชื่อมโยงที่ตีความได้สำหรับโปรตีนและลิแกนด์ที่ไม่เคยพบเห็นมาก่อน AI-Bind มีความสามารถในการคัดกรองคลังสารเคมีขนาดใหญ่อย่างรวดเร็ว และชี้แนะการจำลองการเชื่อมต่ออัตโนมัติที่มีราคาแพงในการคำนวณ โดยจัดลำดับความสำคัญของคู่โปรตีน-ลิแกนด์สำหรับการตรวจสอบ ไปป์ไลน์ต้องใช้คุณสมบัติทางเคมีอย่างง่าย เช่น ลำดับกรดอะมิโนของโปรตีนและไอโซเมอร์สไมล์ของลิแกนด์ ซึ่งช่วยในการเอาชนะข้อจำกัดที่เกี่ยวข้องกับการขาดโครงสร้างโปรตีน 3 มิติที่มีอยู่
พิมพ์ล่วงหน้าได้ที่: https://arxiv.org/abs/2112.13168
ทำไมต้องใช้ AI-Bind?
ข้อบกพร่องของแบบจำลอง ML ที่มีอยู่ในการทำนายการจับโปรตีนและลิแกนด์
ความสนใจของเราในการทำนายการเชื่อมโยงของโปรตีนและลิแกนด์ที่ไม่เคยเห็นมาก่อนผลักดันให้เราแยกประสิทธิภาพการทดสอบของโมเดลการเรียนรู้ของเครื่องที่มีอยู่ (เช่น DeepPurpose) ออกเป็นสามองค์ประกอบ:
(a) การทดสอบแบบถ่ายทอด: เมื่อทั้งโปรตีนและลิแกนด์จากชุดข้อมูลการทดสอบมีอยู่ในข้อมูลการฝึก
(b) การทดสอบแบบกึ่งอุปนัย: เมื่อมีเพียงลิแกนด์จากชุดข้อมูลการทดสอบเท่านั้นที่มีอยู่ในข้อมูลการฝึก และ
(c) การทดสอบแบบอุปนัย: เมื่อทั้งโปรตีนและลิแกนด์จากชุดข้อมูลการทดสอบขาดหายไปในข้อมูลการฝึก
เราเรียนรู้ว่าประสิทธิภาพการทดสอบแบบอุปนัยเท่านั้นที่เป็นหน่วยวัดที่เชื่อถือได้สำหรับการประเมินว่าโมเดลการเรียนรู้ของเครื่องเรียนรู้การเชื่อมโยงจากคุณสมบัติโครงสร้างของโปรตีนและลิแกนด์ได้ดีเพียงใด เราทราบว่าแบบจำลองส่วนใหญ่นำเสนอประสิทธิภาพการทดสอบแบบถ่ายทอด ซึ่งเกี่ยวข้องกับการทำนายการเชื่อมโยงที่มองไม่เห็นในเครือข่ายปฏิสัมพันธ์ระหว่างโปรตีนและลิแกนด์ที่ใช้ในการฝึกอบรม เราสำรวจว่าโมเดล ML บรรลุประสิทธิภาพการถ่ายทอดที่เทียบได้กับอัลกอริธึมที่ง่ายกว่ามากได้อย่างไร (กล่าวคือ โมเดลการกำหนดค่าเครือข่าย) ซึ่งไม่สนใจโครงสร้างโมเลกุลโดยสิ้นเชิง และใช้ข้อมูลระดับเพื่อทำการทำนายที่มีผลผูกพัน
AI-Bind เสนออะไร?
ไปป์ไลน์ AI-Bind เพิ่มประสิทธิภาพการทดสอบแบบเหนี่ยวนำให้สูงสุดโดยรวมผลเชิงลบที่ได้มาจากเครือข่ายในข้อมูลการฝึกอบรม และแนะนำการฝึกอบรมล่วงหน้าแบบไม่มีผู้ดูแลสำหรับการฝังโมเลกุล ไปป์ไลน์ได้รับการตรวจสอบผ่านสถาปัตยกรรมประสาทที่แตกต่างกันสามแบบ ได้แก่ VecNet, VAENet และโมเดล Siamese สถาปัตยกรรมที่มีประสิทธิภาพดีที่สุดใน AI-Bind คือ VecNet ซึ่งใช้ Mol2vec และ ProtVec เพื่อฝังโปรตีนและลิแกนด์ตามลำดับ การฝังเหล่านี้จะถูกป้อนเข้าไปในตัวถอดรหัส (Multi-layer Perceptron) เพื่อทำนายความน่าจะเป็นในการรวม
การตีความของ AI-Bind และการระบุไซต์ที่มีผลผูกพันที่ใช้งานอยู่
เรากลายพันธุ์หน่วยการสร้างบางส่วน (ไตรแกรมของกรดอะมิโน) ของโครงสร้างโปรตีนเพื่อจดจำบริเวณที่มีอิทธิพลต่อการทำนายการจับกันมากที่สุด และระบุว่าเป็นจุดจับที่มีศักยภาพ ด้านล่างนี้ เราตรวจสอบตำแหน่งการจับที่แอคทีฟของ AI-Bind ที่คาดการณ์ไว้บนโปรตีนของมนุษย์ TRIM59 โดยการแสดงภาพผลลัพธ์ของการจำลองการเชื่อมต่ออัตโนมัติ และการทำแผนที่ตำแหน่งที่คาดการณ์ไว้กับกรดอะมิโนที่ตกค้างซึ่งลิแกนด์จับกัน ไซต์การเชื่อมโยงที่คาดการณ์โดย AI-Bind สามารถแนะนำผู้ใช้ในการสร้างตารางที่เหมาะสมที่สุดสำหรับการจำลองการเชื่อมต่ออัตโนมัติ ซึ่งช่วยลดเวลาในการจำลองได้มากขึ้น
การตั้งค่า AI-Bind และการทำนายการจับโปรตีน-ลิแกนด์ (แนวทางสำหรับผู้ใช้ปลายทาง)
การตั้งค่าฮาร์ดแวร์สำหรับ AI-Bind
เราฝึกอบรมและทดสอบโมเดลทั้งหมดของเราผ่านเซิร์ฟเวอร์บนแพลตฟอร์ม Google Cloud ด้วย Intel Broadwell CPU และ NVIDIA Tesla T4 GPU เวอร์ชัน Python ที่ใช้ใน AI-Bind คือ 3.6.6 เวอร์ชัน CUDA ที่ใช้คือ 9.0.
การใช้นักเทียบท่า
โปรดใช้นักเทียบท่านี้เพื่อเรียกใช้ AI-Bind: https://hub.docker.com/r/omairs/foodome2
การใช้ไฟล์ข้อกำหนด
โมดูล Python ทั้งหมดและเวอร์ชันที่เกี่ยวข้องที่จำเป็นสำหรับ AI-Bind แสดงอยู่ที่นี่: Requirements.txt
ใช้ pip install -r needs.txt เพื่อติดตั้งแพ็คเกจที่เกี่ยวข้อง
เวอร์ชัน rdkit ที่ใช้ใน AI-Bind: '2017.09.1' (สำหรับการติดตั้ง ตรวจสอบเอกสารที่นี่: https://www.rdkit.org/docs/Install.html คำสั่ง: conda install -c rdkit rdkit)
ตรวจสอบให้แน่ใจว่าสมุดบันทึก VecNet-User-Frontend.ipynb และไฟล์สามไฟล์ในโฟลเดอร์ AIBind (AIBind.py, init .py และ import_modules.py) อยู่ในโฟลเดอร์เดียวกัน
ดาวน์โหลดและบันทึกไฟล์ข้อมูลภายใต้ /data ลิงค์ดาวน์โหลด: https://zenodo.org/record/7226641
การติดตั้งทางเลือกโดยใช้ Docker
- ดาวน์โหลดไฟล์นักเทียบท่าชื่อ "Predictions.dockerfile"
- บนเทอร์มินัลของคุณ ให้ย้ายไปยังไดเร็กทอรีด้วย dockerfile และรัน : docker build -t aibindpred -f ./Predictions.dockerfile ./
- หากต้องการเรียกใช้อิมเมจเป็นคอนเทนเนอร์: docker run -it --gpus all --name aibindpredcontainer -p 8888:8888 aibindpred คุณสามารถโคลนที่เก็บ git ภายในคอนเทนเนอร์ หรือแนบวอลุ่มในเครื่องของคุณขณะเรียกใช้คอนเทนเนอร์ : docker run -it --gpus ทั้งหมด --name aibindpredcontainer -p 8888:8888 -v ./local_directory:/home aibindpred
- หากต้องการรันเชลล์เพิ่มเติมภายในคอนเทนเนอร์ ให้รัน : docker exec -it aibindpredcontainer /bin/bash
- หากต้องการเรียกใช้อินสแตนซ์โน้ตบุ๊ก Jupyter ภายในคอนเทนเนอร์ ให้รัน : jupyter notebook --ip=0.0.0.0 --port=8888 --allow-root ขั้นตอนข้างต้นจะติดตั้งแพ็คเกจที่จำเป็นทั้งหมด และสร้างสภาพแวดล้อมเพื่อเรียกใช้การคาดการณ์การเชื่อมโยงโดยใช้ AI- ผูก.
เรียกใช้การคาดการณ์จากส่วนหน้า
- จัดระเบียบไฟล์ข้อมูลของคุณในรูปแบบ dataframe ด้วยคอลัมน์ 'InChiKey', 'SMILE' และ 'target_aa_code' บันทึก dataframe นี้ในไฟล์ .csv
- เรียกใช้สมุดบันทึกชื่อ VecNet-User-Frontend.ipynb เพื่อทำการคาดคะเนการเชื่อมโยง ความน่าจะเป็นที่มีผลผูกพันที่คาดการณ์ไว้จะอยู่ใต้ส่วนหัวคอลัมน์ 'การคาดการณ์โดยเฉลี่ย'
รหัสและข้อมูล
ไฟล์ข้อมูล
ไฟล์ข้อมูลทั้งหมดมีอยู่ที่นี่: https://zenodo.org/record/7226641
- /data/sars-busters-consolidated/ไฟล์ฐานข้อมูล: มีข้อมูลการจับกับโปรตีน-ลิแกนด์ที่ได้มาจาก DrugBank, BindingDB และ DTC (Drug Target Commons)
- /data/sars-busters-consolidated/chemicals: มีลิแกนด์ที่ใช้ในการฝึกอบรมและการทดสอบ AI-Bind ด้วยการฝัง
- /data/sars-busters-consolidated/GitData/DeepPurpose and Configuration Model: ฝึกข้อมูลการทดสอบที่เกี่ยวข้องกับการตรวจสอบข้าม 5 เท่าของ Transformer-CNN (DeepPurpose) และ Duplex Configuration Model
- /data/sars-busters-consolidated/GitData/interactions: ประกอบด้วยชุดข้อมูลเชิงลบที่ได้รับจากเครือข่ายที่ใช้ในการฝึกอบรมเครือข่ายประสาทเทียม AI-Bind
- /data/sars-busters-consolidated/GitData: ประกอบด้วยโมเดล VecNet ที่ได้รับการฝึกอบรม การคาดการณ์ที่มีผลผูกพันเกี่ยวกับไวรัสและโปรตีนของมนุษย์ที่เกี่ยวข้องกับโควิด-19 และการสรุปผลลัพธ์จากการจำลองการเชื่อมต่ออัตโนมัติ
- /data/sars-busters-consolidated/master_files: ประกอบด้วยคู่โปรตีน-ลิแกนด์เชิงลบแบบสัมบูรณ์ (ไม่มีผลผูกพัน) ที่ใช้ในการทดสอบ AI-Bind
- /data/sars-busters-consolidated/targets: ประกอบด้วยโปรตีนที่ใช้ในการฝึกอบรมและการทดสอบ AI-Bind ที่มีการฝังที่เกี่ยวข้อง
- /data/sars-busters-consolidated/ปฏิสัมพันธ์: ประกอบด้วยคู่โปรตีน-ลิแกนด์ที่เป็นบวก (การจับ) ที่ได้มาจาก DrugBank, NCFD (สารประกอบธรรมชาติในฐานข้อมูลอาหาร), BindingDB และ DTC
- /data/sars-busters-consolidated/การเชื่อมต่ออัตโนมัติ: ประกอบด้วยไฟล์ทั้งหมดและผลลัพธ์จากการตรวจสอบความถูกต้องของ AI-Bind ในไวรัสและโปรตีนของมนุษย์ที่เกี่ยวข้องกับโควิด-19
- /data/sars-busters-consolidated/การตรวจสอบความถูกต้องของโปรไฟล์ความน่าจะเป็นของการเชื่อมโยง: ประกอบด้วยไฟล์ที่แสดงภาพไซต์การเชื่อมโยงที่ใช้งานอยู่จากการจำลองการจำลองอัตโนมัติ
- /data/sars-busters/Mol2vec: รุ่น Mol2vec และ ProtVec ที่ผ่านการฝึกอบรมมาแล้วมีจำหน่ายที่นี่
- /data/sars-busters-consolidated/s4pred: รวมโค้ดและไฟล์สำหรับการทำนายโครงสร้างรองของ TRIM59
รหัส
ที่นี่เราจะอธิบาย Jupyter Notebooks, Python Modules และสคริปต์ MATLAB ที่ใช้ใน AI-Bind
AIBind
- AIBind.py: ประกอบด้วยคลาส Python สำหรับ AI-Bind รวมสถาปัตยกรรมประสาททั้งหมด: VecNet, VAENet และ Siamese Model
- import_modules.py: ประกอบด้วยโมดูล Python ที่จำเป็นทั้งหมดเพื่อรัน AI-Bind
การกำหนดค่า-รุ่น-5-พับ
- โมเดลการกำหนดค่า - Cross-Validation.ipynb: คำนวณประสิทธิภาพการตรวจสอบข้าม 5 เท่าของโมเดลการกำหนดค่าดูเพล็กซ์บนข้อมูล BindingDB ที่ใช้ใน DeepPurpose
- configuration_bipartite.m: ประกอบด้วยการใช้งาน MATLAB ของโมเดลการกำหนดค่าดูเพล็กซ์
- runscriptposneg.m: รันโมเดลการกำหนดค่าดูเพล็กซ์โดยใช้ลำดับระดับของลิแกนด์และโปรตีน ไฟล์เอาต์พุต summat10.csv และ summat01.csv ใช้ในการคำนวณประสิทธิภาพของโมเดลการกำหนดค่า
DeepPurpose-5-พับ
- วัตถุประสงค์เชิงลึก - ชุดข้อมูลสุดท้าย - Unseen Targets.ipynb: เราดำเนินการตรวจสอบความถูกต้องข้าม 5 เท่าเหนือเป้าหมายที่มองไม่เห็น (การทดสอบแบบกึ่งอุปนัย) บน DeepPurpose โดยใช้ค่าเนกาทีฟที่ได้มาจากเครือข่าย
- วัตถุประสงค์เชิงลึก - ชุดข้อมูลสุดท้าย - Unseen Nodes.ipynb: เราดำเนินการตรวจสอบความถูกต้องข้าม 5 เท่าบนโหนดที่มองไม่เห็น (การทดสอบแบบเหนี่ยวนำ) บน DeepPurpose โดยใช้ค่าเนกาทีฟที่ได้มาจากเครือข่าย
โมลทรานส์
- example_induct_AI_Bind_data.py: เราทำการทดสอบแบบอุปนัยบน MolTrans โดยใช้ตัวอย่างเชิงลบที่ได้มาจากเครือข่าย ซึ่งใช้ในการฝึก AI-Bind
- example_induct_BindingDB.py: เราทำการทดสอบแบบอุปนัยบน MolTrans โดยใช้ข้อมูล BindingDB ซึ่งใช้ในรายงานของ MolTrans
- example_semi_inductive.py: สคริปต์นี้สามารถใช้เพื่อรันการทดสอบแบบกึ่งอุปนัยบน MolTrans
- example_transative.py: สคริปต์นี้สามารถใช้เพื่อรันการทดสอบแบบถ่ายทอดบน MolTrans
DeepPurpose-and-Confuguration-โมเดล
- DeepPurpose Rerun - Transformer CNN.ipynb: เราฝึกทดสอบ DeepPurpose โดยใช้ข้อมูล BindingDB เกณฑ์มาตรฐาน มีการทดลองหลายครั้งเกี่ยวกับ DeepPurpose ซึ่งรวมถึงการสับเปลี่ยนโครงสร้างทางเคมีแบบสุ่มและการวิเคราะห์ระดับของประสิทธิภาพของ DeepPurpose
- โมเดลการกำหนดค่าบน DeepPurpose data.ipynb: เราสำรวจประสิทธิภาพของ Duplex Configuration Model บนชุดข้อมูล BindingDB ที่ใช้ใน DeepPurpose
EigenSpokes
- Eigen Spokes Analysis.ipynb - เราดำเนินการวิเคราะห์ EigenSpokes ที่นี่บนเมทริกซ์ adjacency แบบรวม (เมทริกซ์ adjancecy แบบสี่เหลี่ยมที่มีลิแกนด์และเป้าหมายทั้งในแถวและคอลัมน์)
การเกิดขึ้นของทางลัด
- Without_and_with_constant_fluctuations_p_bind=0.16.ipynb: สร้างและรันโมเดลการกำหนดค่าบนเครือข่ายฝ่ายเดียวของเล่นโดยอิงตามตัวอย่างโปรตีนใน BindingDB ที่นี่ เราจะสำรวจสถานการณ์สมมติสองสถานการณ์ที่เกี่ยวข้องกับความสัมพันธ์ระหว่างระดับและค่าคงที่ของการแยกตัว โดยไม่มีความผันผวนและความผันผวนคงที่ของค่าคงที่ของการแยกตัว
- With_varying_fluctuations.ipynb: สร้างและรันโมเดลการกำหนดค่าบนเครือข่ายฝ่ายเดียวของเล่นโดยอิงตามตัวอย่างโปรตีนใน BindingDB โดยที่ความผันผวนของค่าคงที่การแยกตัวออกจะเป็นไปตามแนวโน้มที่คล้ายกันเช่นเดียวกับในข้อมูล BindingDB
คุณสมบัติทางวิศวกรรม
- ทำความเข้าใจกับคุณสมบัติทางวิศวกรรม.ipynb: เราสำรวจความสามารถในการอธิบายของคุณสมบัติทางวิศวกรรม (คุณสมบัติอย่างง่ายที่แสดงถึงโมเลกุลลิแกนด์และโปรตีน
- คุณสมบัติทางวิศวกรรมของ VecNet - ขนาดที่สำคัญของ Mol2vec และ Protvec.ipynb: ระบุขนาดที่สำคัญที่สุดในการฝัง Mol2vec และ ProtVec ในแง่ของการจับกันของโปรตีน-ลิแกนด์
- คุณสมบัติทางวิศวกรรมของ VecNet Concat Original Features.ipynb: สำรวจประสิทธิภาพของ VecNet หลังจากเชื่อมต่อโปรตีนดั้งเดิมและลิแกนด์ที่ฝังไว้
- VecNet Engineered Features.ipynb: แทนที่การฝัง Mol2vec และ ProtVec ด้วยคุณสมบัติทางวิศวกรรมที่เรียบง่ายในสถาปัตยกรรม VecNet และสำรวจประสิทธิภาพของมัน
การระบุไซต์ที่มีผลผูกพัน
- VecNet-Protein-Trigrams-Study-GitHub.ipynb: เรากลายพันธุ์ไตรแกรมของกรดอะมิโนบนโปรตีน และสังเกตความผันผวนในการคาดการณ์ของ VecNet กระบวนการนี้ช่วยให้เราระบุตำแหน่งการจับที่มีฤทธิ์ที่เป็นไปได้บนลำดับกรดอะมิโน
การทดสอบอินพุตแบบสุ่ม
- VecNet-Unseen_Nodes-RANDOM.ipynb: รัน VecNet บนโหนดที่มองไม่เห็น (การทดสอบแบบเหนี่ยวนำ) โดยที่ลิแกนด์และโปรตีนที่ฝังจะถูกแทนที่ด้วยอินพุตสุ่มแบบเกาส์เซียน
- VecNet-Unseen_Nodes-T-RANDOM-Only.ipynb: รัน VecNet บนโหนดที่มองไม่เห็น (การทดสอบแบบเหนี่ยวนำ) โดยที่การฝังโปรตีนจะถูกแทนที่ด้วยอินพุตสุ่มแบบเกาส์เซียน
- VecNet-Unseen_Targets-RANDOM.ipynb: รัน VecNet บนเป้าหมายที่มองไม่เห็น (การทดสอบแบบกึ่งอุปนัย) โดยที่การฝังลิแกนด์และโปรตีนจะถูกแทนที่ด้วยอินพุตสุ่มแบบเกาส์เซียน
- VecNet-Unseen_Targets-T-RANDOM-Only.ipynb: รัน VecNet บนเป้าหมายที่มองไม่เห็น (การทดสอบแบบกึ่งอุปนัย) โดยที่การฝังโปรตีนจะถูกแทนที่ด้วยอินพุตสุ่มแบบเกาส์เซียน
ชาวสยาม
- Siamese_Unseen_Nodes.ipynb: เราสร้างชุดข้อมูลเชิงลบที่ได้มาจากเครือข่ายและดำเนินการตรวจสอบข้าม 5 เท่าบนโหนดที่มองไม่เห็น (การทดสอบแบบเหนี่ยวนำ) ที่นี่
- Siamese_Unseen_Targets.ipynb: เราทำการตรวจสอบข้าม 5 เท่ากับเป้าหมายที่มองไม่เห็น (การทดสอบแบบกึ่งอุปนัย) ที่นี่
VANet
- VAENet-Unseen_Nodes.ipynb: เราสร้างเนกาทีฟที่ได้รับจากเครือข่ายและดำเนินการตรวจสอบข้าม 5 เท่าบนโหนดที่มองไม่เห็น (การทดสอบแบบเหนี่ยวนำ) ที่นี่
- VAENet-Unseen_Targets.ipynb: เราดำเนินการตรวจสอบข้าม 5 เท่าบนเป้าหมายที่มองไม่เห็น (การทดสอบแบบกึ่งอุปนัย) ที่นี่
การตรวจสอบ
- การวิเคราะห์การทำนาย SARS-CoV-2 VecNet.ipynb: การตรวจสอบความถูกต้องการเชื่อมต่ออัตโนมัติของการคาดการณ์ 100 อันดับบนและล่างที่ทำโดย VecNet เกี่ยวกับโปรตีนของไวรัส SARS-CoV-2 และโปรตีนของมนุษย์ที่เกี่ยวข้องกับโควิด-19
- Binding_Probability_Profile_Golden_Standar_Validation.py: การตรวจสอบความถูกต้องของตำแหน่งการจับที่ได้รับจาก AI-Bind ด้วยข้อมูลการจับโปรตีนมาตรฐานทองคำ
เวคเน็ต
- VecNet-Unseen_Nodes.ipynb: เราสร้างเนกาทีฟที่ได้มาจากเครือข่าย ดำเนินการตรวจสอบข้าม 5 เท่าบนโหนดที่มองไม่เห็น (การทดสอบแบบเหนี่ยวนำ) และทำการคาดการณ์เกี่ยวกับโปรตีนของไวรัส SARS-CoV-2 และโปรตีนของมนุษย์ที่เกี่ยวข้องกับโควิด-19
- VecNet-Unseen_Targets.ipynb: เราดำเนินการตรวจสอบข้าม 5 เท่าบนเป้าหมายที่มองไม่เห็น (การทดสอบแบบกึ่งอุปนัย) ที่นี่
ทรัพยากรภายนอก
- เรียนรู้การเชื่อมต่ออัตโนมัติโดยใช้ Autodock Vina: https://www.youtube.com/watch?v=BLbXkhqbebs
- เรียนรู้การแสดงภาพไซต์ที่มีผลผูกพันที่ใช้งานอยู่โดยใช้ PyMOL: https://www.youtube.com/watch?v=mBlMI82JRfI
อ้างอิง AI-Bind
หากคุณพบว่า AI-Bind มีประโยชน์ในการวิจัยของคุณ โปรดเพิ่มข้อมูลอ้างอิงต่อไปนี้:
@article{Chatterjee2023,
doi = {10.1038/s41467-023-37572-z},
url = {https://doi.org/10.1038/s41467-023-37572-z},
year = {2023},
month = apr,
publisher = {Springer Science and Business Media {LLC}},
volume = {14},
number = {1},
author = {Ayan Chatterjee and Robin Walters and Zohair Shafi and Omair Shafi Ahmed and Michael Sebek and Deisy Gysi and Rose Yu and Tina Eliassi-Rad and Albert-L{'{a}}szl{'{o}} Barab{'{a}}si and Giulia Menichetti},
title = {Improving the generalizability of protein-ligand binding predictions with {AI}-Bind},
journal = {Nature Communications}
}