來源: 發(fā)布時間:2024-3-15 17:32:44
| ||||
人工智能首次成功從零生成原始蛋白質 圖片來源:IAN C. HAYDON 2023年1月26日,美國Salesforce Research、Profluent Bio等機構在《自然-生物技術》上發(fā)表了一項研究成果,該研究創(chuàng)建了一個能夠從頭開始生成人造酶的人工智能(AI)系統(tǒng)。在實驗室測試中,盡管人工生成的氨基酸序列與任何已知的天然蛋白質存在顯著差異,但其中一些酶與自然界中發(fā)現(xiàn)的酶一樣有效。 該實驗表明,雖然自然語言處理是為讀寫語言文本開發(fā)的,但至少可以學習一些生物學的基本原理。Salesforce Research公司開發(fā)的名為ProGen的AI程序,能夠使用下一代標記預測將氨基酸序列組裝成人造蛋白質。 為了創(chuàng)建這個模型,科學家只需將2.8億種不同蛋白質的氨基酸序列輸入機器學習模型,并讓它在幾周內(nèi)消化信息。然后,他們使用來自5個溶菌酶家族的5.6萬個序列,以及有關這些蛋白質的上下文信息對模型進行微調(diào)。 該模型迅速生成了100萬個序列。研究團隊根據(jù)它們與天然蛋白質序列的相似程度,以及AI蛋白質的潛在氨基酸“語法”和“語義”的自然程度,選擇了100個序列進行測試。 在第一批由Tierra生物科學公司體外篩選的100種蛋白質中,該團隊制作了5種人工蛋白質用于細胞測試,并將其活性與雞蛋清中發(fā)現(xiàn)的一種酶——雞蛋清溶菌酶進行了比較。在人類的眼淚、唾液和牛奶中也發(fā)現(xiàn)了類似的溶菌酶,它們可以抵御細菌和真菌。其中,兩種人工酶能夠分解細菌的細胞壁,其活性與雞蛋清溶菌酶相當。但它們的序列只有約18%相同,這兩個序列與任何已知蛋白質的相似性分別為90%和70%。 AI甚至能夠通過研究原始序列數(shù)據(jù)了解酶如何形成。X射線晶體學測量顯示,人造蛋白質的原子結構看起來和它們應該有的樣子一樣,盡管這些序列是前所未有的。 科學家表示,這項新技術可能比獲得諾貝爾獎的“蛋白質設計技術——定向進化”更為強大,它將加速新蛋白質的開發(fā),為已有50年歷史的蛋白質工程領域注入活力。這些新蛋白質幾乎可以用于從疾病治療到降解塑料的任何領域!
《科學新聞》 (科學新聞2024年2月刊 封面)
|
||||
| ||||
| 打印 | 評論 |
| ||||