|
|
小影像、大圖景:人工智能將徹底改變顯微鏡技術(shù) |
|
20年前,計算生物學家Anne Carpenter在完成博士學位時,第一次意識到需要學習計算機編程。
Carpenter在麻省理工學院和哈佛大學的布羅德研究所管理著一個實驗室。當時,她記得自己要么將面對長達3個月的人工圖像分析,要么選擇讓顯微鏡自己運行。她選擇了后者。自那以后,這種自動化方法顯示出了它解決或者至少開始解決一些限制科學家使用顯微鏡技術(shù)手動觀察細胞運作問題的潛力。例如,自動化可以減少識別細胞變化的耗時和細致工作。
Carpenter的實驗室專注于使用軟件來分析數(shù)百萬張圖像中包含的細胞形態(tài)數(shù)據(jù),以加速藥物研發(fā)。“在藥物研發(fā)過程中會遇到很多瓶頸,而來自這些圖像的數(shù)據(jù)被證明對解決每一個瓶頸都很有用:從建立更好的疾病相關(guān)檢測和篩選庫,到預測分析結(jié)果和毒性。”她說。
管理的局限性
位于得克薩斯州休斯敦的萊斯大學生物工程學教授Rebecca Richards-Kortum目前正與MD安德森癌癥中心合作,解決傳統(tǒng)顯微鏡技術(shù)的一些基本局限性。當使用傳統(tǒng)顯微鏡時,在景深(DOF)和空間分辨率之間有一個固定的權(quán)衡:所需的空間分辨率越高,景深就越窄。該團隊與萊斯大學的Ashok Veeraraghavan和MD安德森癌癥中心的Ann Gillenwater合作,開發(fā)了一種名為DeepDOF的計算顯微鏡,其可以在保持分辨率的同時實現(xiàn)比傳統(tǒng)顯微鏡大5倍的景深,顯著減少了圖像處理所需的時間。
Richards-Kortum解釋稱,DeepDOF使用了放置在顯微鏡孔徑處的優(yōu)化相位掩模和基于深度學習的算法,該算法將傳感器數(shù)據(jù)轉(zhuǎn)換為高分辨率、大光圈景深的圖像。
“鑒于其低成本、高速和自動化分析能力,我們希望DeepDOF的觀察范圍有助于手術(shù)中準確評估口腔癌腫瘤邊緣病變組織的數(shù)量。”她說道,“準確評估病變組織的能力有助于優(yōu)化手術(shù)切除結(jié)果,特別是在資源有限的環(huán)境下,如農(nóng)村地區(qū)。”
她表示,使用顯微鏡和人工智能開發(fā)創(chuàng)新醫(yī)療技術(shù)的最大挑戰(zhàn)之一,是展示它們益處的必要性。
為計算顯微鏡提供動力的深度學習算法需要大型數(shù)據(jù)集來訓練它們獨立執(zhí)行任務的能力,但這樣的數(shù)據(jù)集并不總是現(xiàn)成的。然后,必須評估這些算法的性能,將其與當前的分析標準進行比較。“這是整個醫(yī)療保健技術(shù)領(lǐng)域面臨的共同挑戰(zhàn)。”她說。
應對挑戰(zhàn)
Ricardo Henriques負責位于葡萄牙的古爾本基安研究所的光學細胞生物學實驗室。他的跨學科團隊——由光學物理學家、計算機科學家和生物醫(yī)學研究人員組成——致力于改善現(xiàn)有成像技術(shù)的局限性。該團隊專注于兩個關(guān)鍵挑戰(zhàn):如何分析病毒感染活細胞的實時行為,以及如何建立智能顯微鏡技術(shù),以減少在觀察過程中光對生物系統(tǒng)造成的損害,即光毒性。
為了更好的設(shè)想,他建議把細胞比作足球運動員。“你想拍攝一場足球比賽,但攝影機的某些東西對球員來說是有毒的。為了降低他們的風險,你必須盡量減少拍攝時間,但也需要做出正確的決定,捕捉那些有助于真正理解比賽的關(guān)鍵時刻。”Henriques說。
Henriques的團隊正在開發(fā)機器學習算法,以便更好地預測病毒感染過程中細胞內(nèi)的關(guān)鍵事件何時發(fā)生,并捕捉這些時刻。同時,這些算法將試圖減少捕獲無關(guān)變化所花費的時間,減少細胞在有毒環(huán)境中的暴露時間。
對于Henriques來說,建立一個跨學科的團隊來解決這些問題非常重要,因為這項工作涉及多種科學技能。“我們需要徹底改變思維方式,才能將人工智能全面引入科學研究。”
顯微鏡學所固有的許多學科,如物理學和生物學,由于各領(lǐng)域之間的語言障礙存在自然而然的獨立工作傾向。“我認為各組織正在慢慢地投資建設(shè)橋梁,但還需要做更多工作來鼓勵這種做法。”Henriques說。
建造橋梁
地球科學家Matt Andrew就職于加利福尼亞州都柏林的ZEISS光學技術(shù)公司,他的研究重點是多孔巖和沉積巖中的流動和運輸過程。Andrew說,他的工作越來越集中于開發(fā)技術(shù),以更好地利用顯微鏡產(chǎn)生的數(shù)據(jù)。他現(xiàn)在與公司的多個團隊合作,幫助同事將人工智能應用到研究實踐中。
他說,無論是觀察細胞還是巖石,無論他們對深度學習技術(shù)的了解如何,將人工智能引入顯微鏡的日常實踐的關(guān)鍵,是要確保這項技術(shù)可以被任何科學家使用。“構(gòu)建能夠釋放深度學習的潛力和力量、工作迅速且易于使用的工作流程,對它們被采用至關(guān)重要。”Andrew表示。
例如,Andrew和他的團隊使用一個被稱為“解決方案實驗室”的過程來構(gòu)建工作流,通過人工智能自動檢測科學家可能希望調(diào)查的樣本區(qū)域。“你可以使用人工智能來識別與個別特征對應的區(qū)域,然后以更高的分辨率成像。”他補充道,“人工智能技術(shù)通常使用開源庫和共享組件。我們的技術(shù)之所以如此成功,是因為我們確保它們使用起來更簡單,而且打包后更容易消化。”
Andrew認為,我們正處于實現(xiàn)顯微鏡數(shù)據(jù)革命的開端。“回想5年前,我們還不知道可以將這些技術(shù)用于顯微鏡。現(xiàn)在我們正朝著這樣一個方向發(fā)展,讓這些算法成為所有工作場所每個部分的核心。”
Luciano Guerreiro Lucas是總部位于德國韋茨拉爾的徠卡顯微系統(tǒng)公司的負責人,他專注于創(chuàng)建智能軟件解決方案,以解決生命科學和生物制藥領(lǐng)域在圖像數(shù)據(jù)方面面臨的一些大問題。在過去的41年里,他的團隊一直在努力建立一個經(jīng)過預先訓練的深度學習模型庫以及Aivia軟件,其允許任何人利用一些關(guān)鍵的人工智能顯微鏡技術(shù)。
“現(xiàn)有的工具忽略了這樣一個事實,即研究人員可能是生物學或類似學科的專家,但在顯微鏡或圖像分析方面的專業(yè)知識非常有限。”Lucas說,“我們正在創(chuàng)造能夠利用生物學家的專業(yè)知識并可以從中學習的工具。這些工具應該逐漸了解什么是細胞以及它在多種場景下的樣子,并最終自主地進行成像和圖像分析,使研究人員能夠?qū)W⒂诳茖W發(fā)現(xiàn)過程中的創(chuàng)造性和批判性思維部分。”
Lucas指出,目前實現(xiàn)這一想法的挑戰(zhàn)是高質(zhì)量、結(jié)構(gòu)化數(shù)據(jù)的供應有限,以及缺乏標準的圖像格式。“這些問題使得我們很難在這個領(lǐng)域取得更大的進展。此外,確實存在的數(shù)據(jù)往往被保存在孤島中。在研究領(lǐng)域,很難就文件和數(shù)據(jù)標準達成廣泛的共識,研究人員都喜歡用自己的方式做事。”他表示,商業(yè)和學術(shù)部門需要投入更多時間,讓學界了解解決這些問題的好處。
數(shù)據(jù)操作
位于加利福尼亞州舊金山的格萊斯頓研究所所長兼高級研究員Steven Finkbeiner,過去十年一直走在人工智能和顯微鏡研究前沿。自從發(fā)明了一種可以一次追蹤細胞數(shù)月的全自動機器人顯微鏡,他和團隊已經(jīng)產(chǎn)生了極其龐大的數(shù)據(jù)。這些信息讓團隊有能力真正探索人工智能的潛力。他說:“我們一直在‘無恥’地使用我們生成的PB級數(shù)據(jù)。”
例如,他的團隊正在使用面部識別人工智能技術(shù)——將細胞的形態(tài)視為面部進行處理,并隨著時間的推移來識別和追蹤復雜系統(tǒng)(如組織)中的單個細胞。“我們希望這些方法能為研究復雜細胞—細胞相互作用的過程(如神經(jīng)炎癥)開辟新的可能性。”
通過展示神經(jīng)網(wǎng)絡中來自患者的細胞圖像示例,F(xiàn)inkbeiner還教授利用網(wǎng)絡診斷神經(jīng)退行性疾病,如肌萎縮性脊髓側(cè)索硬化癥(ALS)和帕金森病。“我們以一種相對公正的方式詢問網(wǎng)絡,看它能否在圖像中找到任何能夠做出準確診斷的東西,然后我們得到了非常令人鼓舞的結(jié)果。我們希望這能帶來對患者進行分層的新方法,發(fā)現(xiàn)生物標志物并開發(fā)有效的個性化療法。它甚至可能在癥狀出現(xiàn)之前就診斷出患病風險,這將是革命性的。”
他的團隊還使用人工智能來預測細胞的未來命運。“為了做到這一點,我們利用縱向單細胞數(shù)據(jù)和深度學習網(wǎng)絡,尋找一個細胞早期特征來預測其命運。我們現(xiàn)在正在一個癌癥項目中使用這種方法,這將有助于理解為什么有些細胞會產(chǎn)生耐藥性,而有些則不會。”Finkbeiner表示。
將人工智能引入實驗室
Rich Gruskin是總部位于紐約梅爾維爾的尼康儀器公司軟件系統(tǒng)高級總經(jīng)理,他與客戶密切合作,以確保研究人員能夠輕松采用人工智能技術(shù)。
在最近的一個案例中,客戶希望在他們的無標記(明視野)圖像數(shù)據(jù)中識別多種細胞類型。由于圖像是低對比度的,有時只在細微的形態(tài)特征上有所不同,因此要對幾個人工智能網(wǎng)絡進行訓練,使其能在一個分析實驗中協(xié)同工作,以區(qū)分不同的細胞類型。
“我們利用客戶的數(shù)據(jù)集訓練了一個神經(jīng)網(wǎng)絡并運行了它,效果非常好。”他說,“如果嘗試新事物有阻力,我們就會介入,幫助客戶處理信息,建立新的程序,并向他們展示其工作原理。確保應用輕松且快速獲得結(jié)果是建立使用新技術(shù)信心的關(guān)鍵。”
人工智能的未來
總體而言,在學術(shù)和商業(yè)領(lǐng)域工作的研究人員認為,將人工智能應用于科學生活的最大障礙是對未知的恐懼。然而,它與日俱增的影響力是不可否認的。
“變化是在幾個月內(nèi)而不是幾年內(nèi)發(fā)生的。”Henriques說,“看看自動駕駛汽車,它們所做的正是我們想用顯微鏡做的事情,實時觀察周圍環(huán)境并決定如何與之互動,以及如何保持有機體也就是乘車人的生命安全 。”
然而也有一種感覺,雖然變化是不可避免的,但社會需要做出更加堅定的承諾,以確保所有科學家都能從這些新技術(shù)中受益。Finkbeiner認為,創(chuàng)建一些公共圖像庫將對計算機領(lǐng)域有極大幫助,計算機科學家可以使用這些資源開發(fā)新的算法和方法。
“大學甚至高中的孩子也可以將數(shù)據(jù)用于教育和培訓。”Finkbeiner表示,“這個領(lǐng)域的潛力是巨大的,現(xiàn)在投資培養(yǎng)我們需要的一代,讓他們真正帶領(lǐng)我們前進是非常好的。”
他還希望學術(shù)機構(gòu)能更加重視生物學家和計算機科學家之間的合作。“擁有計算機科學系并且認識到多學科價值的大學有機會發(fā)揮領(lǐng)導作用。計算機科學和生物學之間的差距很大,我們需要持續(xù)的努力和支持來點燃火花。”■
Sarah O'Meara 是生命科學領(lǐng)域的自由撰稿人。
鳴謝:“原文由美國科學促進會(www.aaas.org)發(fā)布在2021年4月23日《科學》雜志”。官方英文版請見https://www.science.org/doi/10.1126/science.372.6540.425b。
《科學新聞》 (科學新聞2023年4月刊 科學·生命)