確定生物分子的 3D 形狀是現(xiàn)代生物學和醫(yī)學發(fā)現(xiàn)中最困難的問題之一。公司和研究機構經(jīng)?;ㄙM數(shù)百萬美元來確定分子結構——即使如此巨大的努力也經(jīng)常失敗。
斯坦福大學博士生 Stephan Eismann 和 Raphael Townshend 使用巧妙的新機器學習技術,在計算機科學副教授Ron Dror的指導下,開發(fā)了一種通過計算預測準確結構來克服這個問題的方法。
最值得注意的是,即使僅從少數(shù)已知結構中學習,他們的方法也能成功,使其適用于結構最難通過實驗確定的分子類型。
他們的工作是體現(xiàn)在兩個文件詳細說明了RNA分子和多蛋白復合物,發(fā)表在應用科學上2021年8月27日,并在蛋白質分別于2020年12月,。Science上的論文是與斯坦福大學生物化學副教授Rhiju Das實驗室的合作。
“結構生物學是對分子形狀的研究,它有這樣的口頭禪,即結構決定功能,”湯森說。
研究人員設計的算法可以預測準確的分子結構,并且在此過程中,科學家可以解釋不同分子的工作原理,應用范圍從基礎生物學研究到知情藥物設計實踐。
“蛋白質是執(zhí)行各種功能的分子機器。為了執(zhí)行它們的功能,蛋白質通常會與其他蛋白質結合,”艾斯曼說。“如果你知道一對蛋白質與疾病有關,并且你知道它們在 3D 中如何相互作用,你可以嘗試用一種藥物非常具體地針對這種相互作用。”
Eismann 和 Townshend 是科學論文與斯坦福大學 Das 實驗室的博士后學者 Andrew Watkins 的共同主要作者,也是蛋白質論文與前斯坦福大學博士生 Nathaniel Thomas 的共同主要作者。
設計算法
研究人員沒有具體說明是什么使結構預測或多或少準確,而是讓算法自己發(fā)現(xiàn)這些分子特征。他們這樣做是因為他們發(fā)現(xiàn)提供此類知識的傳統(tǒng)技術可以使算法偏向于某些特征,從而阻止它找到其他信息特征。
“算法中這些手工制作的特征的問題在于,算法偏向于選擇這些特征的人認為重要的東西,你可能會錯過一些你需要做得更好的信息,”艾斯曼說。
“該網(wǎng)絡學會了尋找對分子結構形成至關重要的基本概念,但沒有被明確告知,”湯森德說。“令人興奮的是,該算法清楚地恢復了我們知道很重要的東西,但它也恢復了我們以前不知道的特征。”
在蛋白質方面取得成功后,研究人員接下來將他們的算法應用于另一類重要的生物分子 RNA。他們在他們所在領域長期競爭的一系列“RNA 拼圖”中測試了他們的算法,并且在每種情況下,該工具都優(yōu)于所有其他拼圖參與者,并且沒有專門為 RNA 結構設計。
標簽:
免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!