AI在蛋白摺疊裡再一次戰勝人類

首頁 > 科技

AI在蛋白摺疊裡再一次戰勝人類

來源:跳高的魚 釋出時間:2022-09-27 21:51

出品丨虎嗅科技組

作者丨蘇北佛樓蜜

題圖丨視覺中國

近日,科學突破獎基金會宣佈了2023科學突破獎(Breakthrough Prize)獲獎名單。科學突破獎有“科學界的奧斯卡”之稱,它旨在表彰在生命科學、基礎物理學和數學方面的突破性成就。

 

谷歌DeepMind科學家因開發人工智慧 (AI) 系統而獲得了300萬美元的獎金,該系統預測了幾乎所有已知蛋白質如何摺疊成3D形狀。

 

研究人員使用AlphaFold程式實現了這一壯舉,該程式於2018年首次開發並於2021年7月對外公開發布。開源程式可以根據構成蛋白質的氨基酸序列預測蛋白質的3D結構。蛋白質的結構決定了它的功能,因此AlphaFold識別2億個蛋白質結構的能力讓自己成為了幫助識別人類可以利用新蛋白質的主力軍。 

 

早在釋出之初,中國生物結構學領軍人物、西湖大學校長施一公就曾評價稱:“依我之見,這是人工智慧對科學領域最大的一次貢獻,也是人類在 21 世紀取得的最重要的科學突破之一。

 

著名藥企Dewpoint Therapeutics董事會成員兼戰略顧問、Relay Therapeutics聯合創始人Mark Murcko也認為,AlphaFold已經打開了一個工具箱,並向全世界展示了可能的東西。

 

“現在我們將有幾十個實驗室,每個實驗室都在思考略有不同的問題集,包括蛋白質-配體結構的預測、變構口袋的成藥性、蛋白質-蛋白質相互作用和RNA靶標,以及疫苗免疫原和從頭治療性蛋白質的設計。”Mark Murcko在曾採訪中表示。

 

從正式釋出到此次的得獎已經過去了4年時間,業內有關AlphaFold的討論始終更沒有終止,從最開始科學界的為之振奮到現階段更多應用的展開,如今,4歲的AlphaFold也給科學家帶來了新的驚喜。

 

成功預測蛋白質結構為什麼如斯重要,新技術又能給人類社會帶來哪些便益?

生物“骨架”

蛋白質是組成人體所有細胞和組織的重要成分。在我們體內,幾乎所有重要組成部分都有蛋白質的影子。此外,蛋白質是生命的物質基礎,沒有蛋白質就沒有生命,它仍是構成細胞的最基本的有機物,擔當著生命活動承擔者的角色。

 

在蛋白質中,氨基酸為最基本的組成單位,它是將生命和其他各種樣式的生命活動聯絡在一起的基本物質。人體內的蛋白質分為很多種型別,它們的作用、性質各不相同,但所有蛋白質都是由20種氨基酸按照不同的比例相互組合而成的,並且在體內不斷進行著更新和代謝。

 

他們就像微小的、難以理解的謎題,存在於細菌、植物、動物各種生物體中,當它們被製造出來時,會在幾毫秒內摺疊起來,但其結構非常複雜,試圖猜測它們會變成什麼形狀幾乎是不可能的。

蛋白質的基本機構

 

在結構上,蛋白質分子中的肽鏈並不是直鏈形狀,而是按照其內在規律發生捲曲或者是摺疊,從而形成特定的空間結構,這就是蛋白質的二級結構。

 

在二級結構的基礎上,蛋白質肽鏈還會按照一定的空間結構,發展形成比二級結構更為複雜的三級結構。具有三級結構的肽鏈按照特定的空間排列順序組合在一起,形成的聚集體結構就是蛋白質的四級結構。由於構成蛋白質的氨基酸種類繁多,氨基酸的排列順序種類繁多,所以,雖然只有20種氨基酸,但蛋白質的種類卻特別多。

 

蛋白質的各級結構

 

美國分子生物學家賽勒斯·萊文塔爾(Cyrus Levinthal)在1969年的一篇論文中指出了一個悖論,即儘管蛋白質具有大量可能存在構型,但仍能快速而精確地摺疊成不同的構像。 據估計,給定的蛋白質可能有 10^300 種最終結構。 

 

因此,如果人們試圖透過逐個嘗試來獲得正確的蛋白質形狀,那麼獲得正確答案所需要的時間將比宇宙存在的時間更長。 

 

此前,科學家們有辦法視覺化蛋白質並分析它們的結構,但這是一項緩慢而艱鉅的工作。據《自然》雜誌報道,最常見的蛋白質成像方法是利用X射線晶體學,透過在蛋白質的固體晶體上發射X射線,並測量這些射線是如何衍射,以確定蛋白質的排列方式。據DeepMind稱,這項實驗工作已經確定了大約190,000個蛋白質的形狀,這一技術也讓冷凍電鏡在過去十年中成為許多結構生物學實驗室的首選工具。

 

長期以來,科學家們一直想知道蛋白質的組成部分——一串不同的氨基酸是如何描繪出其最終形狀。研究人員表示,在1980年代和1990年代,早期使用計算機預測蛋白質結構的的結果並不理想。當科學家將其應用於不同蛋白質時,自己已發表論文中的結論往往會被反覆推翻瓦解。

 

去年,DeepMind 釋出了人體和20個研究物種中每種蛋白質的蛋白質形狀預測。如今,他們已經將這些預測擴充套件到基本上所有的蛋白質。

 

DeepMind的AlphaFold建立的蛋白質結構3D 影象(圖片來源:DeepMind)

 

DeepMind在一份宣告中說: “如今演算法包含植物、細菌、動物和其他生物的預測結構,為眾多重要問題的解決提供了許多新機會,包括可持續性發展、糧食不安全和被忽視的疾病等方面。”

 

開源程式根據蛋白質的氨基酸序列或構成蛋白質的分子單元進行預測。這些單獨的單元連線成一條長鏈,然後“摺疊”成3D形狀。蛋白質的3D結構決定了該蛋白質可以做什麼,因此能夠從其氨基酸序列推斷蛋白質的形狀這一功能顯得十分強大。

 

AlphaFold在試圖解釋蛋白質結構時,主要功過積累有關氨基酸序列和相互作用的原理。該演算法現在可以在幾分鐘內預測蛋白質的形狀,並精確到原子級別。

 

這一功能也讓AlphaFold一經發布,就收穫了大量關注及喝彩,曾經的轟動並未消散,它的影響仍在繼續蔓延。

從靶點到成藥的一場變革

2022年,挪威生命科學大學研究員Vilde Leipart 使用 AlphaFold 揭示了卵黃蛋白的結構——卵黃蛋白是一種由所有產卵動物製造的生殖和免疫蛋白,這一發現可能會帶來新的方法來保護蜜蜂和魚類等重要的產卵動物免受疾病侵害。不止於此,AlphaFold的速度和準確性正在加速藥物發現過程,能夠讓藥企更快地為患者提供新藥。

 

就像基因編輯工具CRISPR徹底改變了人類疾病研究和遺傳錯誤疾病的藥物設計方向,AlphaFold的正在從根本上改變新藥的發明方式。

 

X射線檢測的蛋白質晶體

 

想要研發藥物,通常需要第一時間鎖定導致疾病的相關蛋白質或基因。然後對症下藥,尋找成功“擊中”目標的分子或化合物。這一工作的代價是巨大的,藥物發現平均需要 10 年以上的時間,每種藥物開發經費可達28億美元。

 

例如,冠狀病毒上的刺突蛋白被就是針對COVID-19的靶標,針對這一目標,我們發現了可以粘附在刺突上並中和刺突的疫苗及單克隆抗體。

 

但是,大多數疾病不像COVID-19一般,有一個大而明確的目標,可以用眾所周知的武器(如抗體)來“攻擊”它。不同的疾病可能有成千上萬的潛在藥物,這是一個反覆試驗的過程。

 

人工智慧已成為加速藥物發現的一種方式。訓練有素的系統可以檢視治療目標,然後從選項庫中識別有希望成功的候選藥物,這比實驗室中的科學家人工研發的速度要快得多。不僅僅停留在Alphabet所依賴的理論,我們已經看到了更多實際的應用例子。

 

2022年8月,英國Exscientia公司開發的人工智慧系統發現了一種抗癌分子,該分子現在正進入臨床試驗,這一過程僅用了短短的八個月。如果沒有人工智慧,這一發現可能需要4到5年的時間。

 

如今,大多數治療癌症和其他疾病的新藥都是透過靶向體內特定的蛋白質來發揮作用的。理想情況下,我們希望設計小分子藥物以非常精確地結合到整個靶蛋白的一個微小區域,從而改變其功能。藥物化學家總是更喜歡擁有準確的3D蛋白質結構,以便他們可以基於結構來設計藥物。

 

甚至在藥物發現階段開始之前,3D蛋白質結構就可以幫助藥物研發團隊評估目標蛋白的成藥性,以便讓研究人員能夠了解哪些目標成藥相對簡單,哪些將帶來重大挑戰,

 

根據倫敦癌症研究釋出的訊息,在其開展的多個藥物發現專案中,明晰靶蛋白的3D結構發揮了重要作用。預測準確3D蛋白質結構的能力通常對藥物發現非常有價值,在設計化學探針以評估目標在生物學和疾病病理學中的作用時也是如此。例如,更好地預測有用的藥物靶點、翻譯疾病預測細胞和動物模型,以及預測人類的早期檢測毒理學。

 

除此之外,蛋白質機構預測還能改善抗生素的抗藥性難題。根據CDC估計,2019年,抗微生物藥物耐藥性每年給美國經濟造成550億美元的損失,其中包括200億美元的醫療保健成本及350億美元的生產力損失,抗生素耐藥性也助長了“超級細菌”的出現。

 

今年九月,科羅拉多大學博爾德分校的Marcelo Sousa和Megan Mitchell教授使用AlphaFold研究與抗生素耐藥性有關的蛋白質,並確定了蛋白質結構,科學家可以在大約30分鐘內識別出一種細菌蛋白質結構,在沒有人工智慧的干涉干與下,這一動作可能會花費十年時間。

 

毫無疑問,AI技術正在潛移默化的影響著醫療行業,DeepMind僅僅是一個成功的開端,而這條路沒有終點。

上一篇:位元組跳動 VR... 下一篇:類似於部署工...
猜你喜歡
熱門閱讀
同類推薦