(取自DeepMind X)
當地時間11月1日,Google旗下的AI研究機構DeepMind在官網發表了,蛋白質結構預測模型 AlphaFold的最新技術進展,目前已顯著提升了預測準確性,並將覆蓋範圍從蛋白質擴展至其他生物分子,包括配體(小分子)。
據悉,AlphaFold可以對蛋白質數據庫 (PDB) 中的幾乎所有分子進行預測,包括配體、蛋白質、核酸(DNA 和 RNA)以及含有翻譯後修飾(PTM) 的分子,達到原子精度實驗室級別水準,這對於醫藥研究至關重要。
Alphafold蛋白質結構數據庫:https://alphafold.ebi.ac.uk/
超越蛋白質折疊
自2020年Google首次發布AlphaFold以來,徹底改變了蛋白質及其相互作用的理解方式,成功預測了蛋白質的3D結構,幫助生物科學領域實現重大技術突破。
AlphaFold實現了單鏈蛋白質預測的根本性突破,然後AlphaFold-Multimer 擴展到包含多個蛋白質鏈的複合物,接著是AlphaFold2.3提高了性能並擴大了對更大複合物的覆蓋範圍。
在2022年,AlphaFold的結構預測幾乎涵蓋了科學已知的所有編目蛋白質,這些預測通過與歐洲生物資訊學研究所(EMBL-EBI)合作,已在 AlphaFold 蛋白質結構數據庫免費提供。
迄今為止,超過 190 個國家的 140 萬用戶已經訪問了 AlphaFold 蛋白質結構數據庫,世界各地的科學家已經使用 AlphaFold 的預測來幫助推進從加速新的瘧疾疫苗研發和推進癌症藥物發現,到開發用於解決污染的塑料降解酶的研究。
最新的AlphaFold模型不僅侷限於蛋白質折疊,還能夠在配體、蛋白質、核酸以及翻譯後修飾等方面生成高度精確的結構預測。
加速藥物研發
數據分析顯示,最新的AlphaFold模型在一些與藥物發現相關的蛋白質結構預測問題上,大大優於AlphaFold2.3,如抗體結合。
此外,準確預測蛋白質、配體結構對於藥物發現是一種重要工具,可以幫助科學家辨識和設計新的分子,這些分子可能會成為藥物。
當前的醫藥產業的標準,是使用「對接方法」來確定配體和蛋白質之間的相互作用,這些對接方法需要一個剛性的參考蛋白質結構和一個建議的配體結合位置。
最新的AlphaFold模型通過優於最好的報告的對接方法,設定了蛋白質-配體結構預測的新標準,而無需參考蛋白質結構或配體口袋的位置,允許對以前從未在結構上進行過表徵的全新蛋白質進行預測。
還可以共同建模所有原子的位置,使其能夠表示蛋白質和核酸在與其他分子相互作用時的完全固有的靈活性,這是對接方法無法實現的。
例如,以下是最新AlphaFold模型預測的結構(以顏色顯示)與實驗確定的結構(以灰色顯示)緊密匹配的三個最近發表的、具有治療相關性的案例:
對 PORCN (1)、KRAS (2) 和 PI5P4Kγ (3) 的預測
PORCN:一種臨床階段的抗癌分子與其目標以及另一種蛋白質結合在一起。
KRAS:與一個重要的癌症目標的共價配體(一種分子膠水)形成的三元復合物。
PI5P4Kγ:一種選擇性的脂質激酶的變構抑制劑,具有包括癌症和免疫性疾病在內的多種疾病影響。
對生物學全新認識
通過解鎖蛋白質和配體結構以及核酸和含有翻譯後修飾的結構的建模,最新的AlphaFold模型提供了一種更快速、準確的工具,用於檢查基礎生物學。
例如,涉及到CasLambda與crRNA和DNA結合的結構,這是CRISPR家族的一部分。
CasLambda與被廣泛稱為「基因剪刀」的CRISPR-Cas9系統共享基因編輯的能力,研究人員可以使用它來改變動物、植物和微生物的DNA。CasLambda的較小尺寸可能使其在基因編輯中使用更為高效。
與 crRNA 和 DNA(CRISPR 子系統的一部分)結合的 CasLambda (Cas12l) 的預測結構
AlphaFold能夠對此類複雜系統進行建模,這表明,AI模型可以幫助醫療生物界更好地理解這些類型的機制,並加速在治療過程中的應用。
DeepMind表示,最新的AlphaFold模型能幫助生物醫學突破並建構下一個「數位生物學」時代,為基因組學、生物可再生材料、植物免疫、潛在治療靶點、藥物設計等提供詳細的非常重要的預測。
本文為巴比特授權刊登,原文標題為「谷歌AlphaFold模型迎來重大突破!可以預測生物分子、配體」