|
|
科學(xué)家借助AI技術(shù)破解蛋白質(zhì)結(jié)構(gòu)預(yù)測難題 |
|
科學(xué)家們一直希望通過基因序列簡單地預(yù)測蛋白質(zhì)形狀——如果能夠成功,這將開啟一個(gè)洞察生命運(yùn)作機(jī)理的新世界。英國DeepMind公司和美國華盛頓大學(xué)分別公布了多年工作的成果:先進(jìn)的建模程序,可以預(yù)測蛋白質(zhì)和一些分子復(fù)合物的精確三維原子結(jié)構(gòu),并將這些結(jié)構(gòu)放入公開的數(shù)據(jù)庫免費(fèi)供全球科研人員使用。
據(jù)DeepMind公司報(bào)告顯示,其人工智能程序AlphaFold預(yù)測出98.5%的人類蛋白質(zhì)結(jié)構(gòu),有助于深入理解一些關(guān)鍵生物學(xué)信息,從而更好開展藥物研發(fā)。相關(guān)論文2021年7月15日在線發(fā)表于《自然》。
研究人員提供了第一個(gè)可以定期預(yù)測蛋白質(zhì)結(jié)構(gòu)的計(jì)算方法,即使在沒有類似結(jié)構(gòu)的情況下也能達(dá)到原子級(jí)精度。研究人員在具有挑戰(zhàn)性的第14屆蛋白質(zhì)結(jié)構(gòu)預(yù)測關(guān)鍵評估(CASP14)中,驗(yàn)證了這個(gè)完全重新設(shè)計(jì)的基于神經(jīng)網(wǎng)絡(luò)的模型——AlphaFold,其在大多數(shù)情況下顯示出與實(shí)驗(yàn)相競爭的準(zhǔn)確性,并大大超過了其他方法。最新版本的AlphaFold的基礎(chǔ)是一種新的機(jī)器學(xué)習(xí)方法,通過利用多序列排列的方式,將有關(guān)蛋白質(zhì)結(jié)構(gòu)的物理和生物知識(shí)納入深度學(xué)習(xí)算法的設(shè)計(jì)中。
美國華盛頓大學(xué)創(chuàng)建的高精確的蛋白質(zhì)結(jié)構(gòu)預(yù)測程序名叫RoseTTAFold,基于深度學(xué)習(xí),它不僅能預(yù)測蛋白質(zhì)的結(jié)構(gòu),還能預(yù)測蛋白質(zhì)之間的結(jié)合形式。僅需10分鐘,RoseTTAFold就能用一臺(tái)游戲電腦準(zhǔn)確計(jì)算出蛋白質(zhì)結(jié)構(gòu)。相關(guān)論文2021年7月15日刊登于《科學(xué)》。
RoseTTAFold是一個(gè)“三軌”神經(jīng)網(wǎng)絡(luò),這意味著它同時(shí)考慮一維蛋白質(zhì)中的氨基酸序列、二維蛋白質(zhì)的氨基酸如何相互作用以及蛋白質(zhì)可能的三維結(jié)構(gòu)。在這種架構(gòu)中,一維、二維和三維信息來回流動(dòng),從而使神經(jīng)網(wǎng)絡(luò)能夠共同推理出蛋白質(zhì)的化學(xué)部分與其折疊結(jié)構(gòu)之間的關(guān)系。
該團(tuán)隊(duì)已經(jīng)使用RoseTTAFold計(jì)算了數(shù)百種新的蛋白質(zhì)結(jié)構(gòu),其中包括許多來自人類基因組的知之甚少的蛋白質(zhì)。研究人員還生成了與人類健康直接相關(guān)的蛋白質(zhì)結(jié)構(gòu),包括與非正常脂質(zhì)代謝、炎癥障礙和癌細(xì)胞生長相關(guān)的蛋白質(zhì)結(jié)構(gòu)。這些成果都表明,RoseTTAFold可以僅用從前所需時(shí)間的很小一部分,構(gòu)建出復(fù)雜生物組件的模型!
《科學(xué)新聞》 (科學(xué)新聞2022年2月刊 封面)