作者:Mike May/ 文 高大海 倪偉波/ 譯 來(lái)源: 發(fā)布時(shí)間:2018-6-26 16:58:13
大數(shù)據(jù),大圖景
——當(dāng)代謝組學(xué)遇上系統(tǒng)生物學(xué)

 
一個(gè)被遺忘的第四類(lèi)分子生物學(xué)可能是最貼近表型的。幾十年來(lái),人們一直專(zhuān)注于三個(gè)分子:DNA產(chǎn)生RNA,RNA產(chǎn)生蛋白質(zhì),F(xiàn)在,許多科學(xué)家都開(kāi)始注意到了另一個(gè)組分:代謝產(chǎn)物,它們是由機(jī)體內(nèi)的生化途徑中的蛋白質(zhì)所產(chǎn)生的。人們聽(tīng)到了太多關(guān)于基因和基因型的信息,但同樣重要的是,人們想要探究基因與環(huán)境因子互作時(shí)發(fā)生了什么,同樣也想找到區(qū)分健康與疾病的分子表型,這些正是代謝組學(xué)的用武之地。
 
毫無(wú)疑問(wèn),那些著眼于生命科學(xué)的相互元素的系統(tǒng)生物學(xué)家想要將代謝組學(xué)與基因組關(guān)聯(lián)起來(lái)。“沒(méi)有基因組序列,代謝組學(xué)不能真正發(fā)揮自身作用,”位于美國(guó)加州門(mén)洛帕克的專(zhuān)門(mén)從事基因組學(xué)分析的Pacific Biosciences公司首席科學(xué)官Jonas Korlach說(shuō) 。“一旦你發(fā)現(xiàn)了代謝產(chǎn)物并想將它們作為新抗生素或新途徑進(jìn)行分析,就需要基因組信息來(lái)鑒定出相關(guān)的酶并克隆這些基因。”
 
西澳大利亞莫道克大學(xué)的分離科學(xué)和代謝組學(xué)實(shí)驗(yàn)室主任Robert Trengrove同意這種看法,盡管代謝組學(xué)對(duì)系統(tǒng)生物學(xué)的影響尚處于起步階段,但他看到了積極的開(kāi)始,而且關(guān)鍵在于團(tuán)隊(duì)合作。 “在 ‘組學(xué)’方面我們有很擅長(zhǎng)做信息學(xué)的人,”Trengrove說(shuō),“但很少有人能跨多個(gè)‘組學(xué)’領(lǐng)域,包括脂類(lèi)組學(xué)和表觀遺傳學(xué)。”
 
Trengrove的團(tuán)隊(duì)已經(jīng)聯(lián)合其他團(tuán)隊(duì),通過(guò)從ICU采集血液樣本構(gòu)建患者的代謝譜。他說(shuō),“通過(guò)這種方式,我們能夠開(kāi)始評(píng)估各種化合物作為生物標(biāo)記物和病人康復(fù)指示物的用途。”為了確切知道發(fā)生了什么,生物標(biāo)記模塊必須與蛋白質(zhì)組學(xué)和基因組學(xué)相關(guān)聯(lián),但這項(xiàng)工作才剛剛展開(kāi)。
 
盡管如此,系統(tǒng)生物學(xué)已經(jīng)成為了生物學(xué)的核心。傳統(tǒng)上,生物學(xué)已將機(jī)體或細(xì)胞分解為各個(gè)部分,F(xiàn)在,系統(tǒng)生物學(xué)似乎接受了亞里士多德的觀點(diǎn)——“整體大于其組成部分的總和”,并借用包括代謝組學(xué)等多個(gè)領(lǐng)域的方法。用于處理來(lái)自這些領(lǐng)域統(tǒng)稱為“大數(shù)據(jù)”的工具正在涌現(xiàn)。
 
關(guān)于數(shù)據(jù)的再思考
 
總體來(lái)說(shuō),代謝組學(xué)創(chuàng)造了一個(gè)數(shù)字挑戰(zhàn)。“代謝組學(xué)目前的用處包括:在生物樣品庫(kù)中研究大規(guī)模基因組隊(duì)列,將基因型和具有特定表型的基因組變異相關(guān)聯(lián),通過(guò)監(jiān)測(cè)食品成分或內(nèi)源性代謝物的營(yíng)養(yǎng)研究,或?yàn)榱餍胁W(xué)研究中的檢測(cè)提供支持,”總部位于馬薩諸塞州沃爾瑟姆市的賽默飛世爾科技公司蛋白質(zhì)組和代謝組學(xué)部門(mén)的營(yíng)銷(xiāo)總監(jiān)Andreas Huhmer說(shuō)。這些研究會(huì)產(chǎn)生大量的數(shù)據(jù)。在人類(lèi)中已經(jīng)發(fā)現(xiàn)的7500多種代謝物中,只有2500種直接來(lái)自于人體;剩余的則有其他來(lái)源,包括人體消化的食物和藥物。
 
從數(shù)字上來(lái)說(shuō),我們可能只是在起點(diǎn)。正如Huhmer所說(shuō),“未來(lái),預(yù)計(jì)將確定更多的代謝物,特別是在對(duì)腸道中代謝物以及關(guān)聯(lián)新陳代謝的微生物的解析中持續(xù)出現(xiàn)新的進(jìn)展。”腸道菌群在代謝的刻畫(huà)中發(fā)揮重要作用,為研究與生活方式和飲食習(xí)慣有關(guān)的慢性和急性疾病的影響提供了信息寶庫(kù),例如二型糖尿病和肥胖病。
 
目前,代謝組學(xué)有Metabolomics Workbench和MetaboLights兩個(gè)數(shù)據(jù)平臺(tái),它們都能給科學(xué)家團(tuán)隊(duì)提供更多的數(shù)據(jù)可供分析,使他們能夠在全球范圍內(nèi)共享數(shù)據(jù)。
 
利用脂類(lèi)組學(xué)
 
脂類(lèi)是代謝組學(xué)拼圖的另一塊完整組成,但至少與DNA,RNA和蛋白質(zhì)相比,對(duì)這些分子的研究相對(duì)較少,是一個(gè)一直被忽視的組學(xué)領(lǐng)域。然而,脂類(lèi)為系統(tǒng)生物學(xué)提供了一個(gè)有用的工具,因?yàn)?ldquo;它們是可以被量化的,告訴我們關(guān)于細(xì)胞或組織的狀態(tài),”位于德國(guó)德累斯頓的Lipotype公司首席執(zhí)行官Kai Simons解釋道。
 
該公司的Lipotype Shotgun Lipidomics技術(shù)提供了量化的方案。這種技術(shù)對(duì)整個(gè)萃取液進(jìn)行質(zhì)譜分析,而不是先用液相色譜法分離。只用一微升血液,這種技術(shù)便可達(dá)到Simons所謂的“識(shí)別多達(dá)2300的脂質(zhì)的絕對(duì)量化。”
 
科學(xué)家寄送樣品到Lipotype公司,它們會(huì)在短短兩個(gè)星期完成測(cè)試。如果需要的話,該公司的軟件可向希望查看數(shù)據(jù)的研究人員開(kāi)放。盡管如此,生物學(xué)家還需要收集更多關(guān)于各種代謝物的數(shù)據(jù),并確定它們的作用。事實(shí)上,理解更多代謝產(chǎn)物的功能可能對(duì)理解完整的生物系統(tǒng)產(chǎn)生最大的影響。
 
揭示功能
 
即使我們能夠檢測(cè)任何生物基質(zhì)中的所有的蛋白質(zhì)和代謝產(chǎn)物,位于馬薩諸塞州米爾福德的Waters 公司健康科學(xué)營(yíng)銷(xiāo)總監(jiān)Jose Castro-Perez說(shuō)道,“我們也僅知道其中一小部分的功能。”科學(xué)家們需要能完成代謝物檢測(cè)并同時(shí)解析其生物學(xué)功能的方法。這就需要分析和生物信息學(xué)工具來(lái)進(jìn)行結(jié)合多種形式組學(xué)數(shù)據(jù)的疾病或治療相關(guān)的途徑分析。
 
為此,Waters 公司開(kāi)發(fā)了SONAR軟件,這是配合該公司的Xevo G2-XS QToF系統(tǒng)的一種數(shù)據(jù)采集模式,該系統(tǒng)提供了四極桿飛行時(shí)間質(zhì)譜(QToF)。SONAR軟件可以在單樣本注入的數(shù)據(jù)獨(dú)立分析(data independent analysis ,DIA)實(shí)驗(yàn)中,將完整的前體和碎片離子光譜樣品進(jìn)行歸類(lèi),使研究人員獲得蛋白質(zhì)或代謝物的定量和定性信息。“這種新的DIA采集模式比其他的DIA方法更先進(jìn),因?yàn)樗峁┝烁旌透噙x擇性的復(fù)雜樣品的數(shù)據(jù)采集,”Castro-Perez說(shuō)。“此外,這種新方法可以提高數(shù)據(jù)庫(kù)的檢索和定量精度的可靠性。”Xevo G2-XS QToF系統(tǒng)可以與Waters公司的色譜工具進(jìn)行諸如用于高通量的超高效液相色譜法的集成。
 
“生成高質(zhì)量的數(shù)據(jù)是很重要的,但最終你需要的是從原始數(shù)據(jù)中得到有意義并可操作的生物信息,”Castro-Perez說(shuō)。為了綜合信息、簡(jiǎn)化數(shù)據(jù)處理以及處理流程,Waters公司開(kāi)發(fā)了一款客戶機(jī)/服務(wù)器應(yīng)用的Symphony 軟件,允許一個(gè)或多個(gè)數(shù)據(jù)分析,或處理功能按順序的自動(dòng)化。該工具甚至可以在儀器運(yùn)行后立即啟動(dòng)數(shù)據(jù)處理,并在沒(méi)有用戶干預(yù)功能的情況下完成數(shù)據(jù)處理,這一特點(diǎn)在大規(guī)模研究中是非常重要的。
 
整合互補(bǔ)的方法
 
除了所有這些存儲(chǔ)和數(shù)據(jù)分析方面的進(jìn)展,科學(xué)家們?nèi)栽谘芯看x組學(xué)上面臨的重大阻礙。“在非定向工作流程中的瓶頸之一是鑒定未知的化合物,”總部設(shè)在德國(guó)不萊梅的 Bruker Daltonics 公司代謝組學(xué)市場(chǎng)經(jīng)理Aiko Barsch說(shuō)。“這是質(zhì)譜和核磁共振同時(shí)具有的優(yōu)勢(shì)。”
 
例如,高分辨率,精量化(HRAM)質(zhì)譜可以揭示未知化合物中的元素組成。“質(zhì)譜技術(shù)已經(jīng)取得了長(zhǎng)足的發(fā)展,而且提供‘極端方法’的系統(tǒng)可以使研究人員從所謂的‘同位素精細(xì)結(jié)構(gòu)’中讀出元素的構(gòu)成,”Barsch說(shuō),“但如果樣品中出現(xiàn)一個(gè)真正未知的,完全不在數(shù)據(jù)庫(kù)中記錄的東西,這就需要從頭進(jìn)行結(jié)構(gòu)解析的能力,那將主要由核磁共振完成。”所以,質(zhì)譜和核磁共振可以一起使用,作為代謝組學(xué)中的互補(bǔ)技術(shù)。
 
為了進(jìn)一步深挖復(fù)雜樣品,研究人員常常將質(zhì)譜與液相或氣相色譜聯(lián)用。“這將有助于確定代謝特征,”Barsch解釋說(shuō),“因?yàn)閷⒎蛛x和高分辨率檢測(cè)聯(lián)用可以校準(zhǔn)樣品中的特定成分。”
 
核磁共振的進(jìn)展也很有用。如今的平臺(tái)中的標(biāo)準(zhǔn)操作程序允許科學(xué)家將方法從一個(gè)平臺(tái)傳輸?shù)搅硪粋(gè)平臺(tái)。在代謝組學(xué)中,團(tuán)隊(duì)協(xié)作水平的不斷提高使得這些改進(jìn)對(duì)科學(xué)家在國(guó)際上的合作至關(guān)重要,因?yàn)樗麄冃枰獙で髞?lái)自不同實(shí)驗(yàn)室核磁共振數(shù)據(jù)的一致性。
 
盡管代謝組學(xué)研究人員同時(shí)用到質(zhì)譜和核磁共振,但位于加州圣克拉拉的安捷倫科技公司的代謝組學(xué)和蛋白質(zhì)組學(xué)的市場(chǎng)總監(jiān)Steve Fischer說(shuō),“由于儀器的成本、測(cè)量的廣度和靈敏度,目前的趨勢(shì)強(qiáng)烈傾向于質(zhì)譜分析解決方案。”
 
由于大量的可被檢測(cè)的代謝物的質(zhì)譜是重疊的,色譜與質(zhì)譜聯(lián)用能夠?qū)悠愤M(jìn)行分離、提供深入的分析。“從廣義上講,一個(gè)液相色譜 / 質(zhì)譜系統(tǒng)可以比氣相色譜 / 質(zhì)譜系統(tǒng)測(cè)量更多的東西,”Fischer說(shuō)。一些樣品不易揮發(fā),這就可以用到氣相色譜。然而,“這兩個(gè)系統(tǒng)都提供了質(zhì)譜信息,這些信息可以用來(lái)追蹤并最終鑒定出那些已被發(fā)現(xiàn)的代謝物,以及代謝物的豐度,”他說(shuō)。通過(guò)比較樣本,這些信息揭示了哪些代謝物正在發(fā)生變化,數(shù)量是多少。
 
分析這些變化需要專(zhuān)門(mén)的軟件。2016年,安捷倫科技公司發(fā)布了VistaFlux軟件,可以進(jìn)行穩(wěn)定標(biāo)記同位素示蹤。由于各種生物途徑都能產(chǎn)生代謝產(chǎn)物,“解析產(chǎn)生代謝產(chǎn)物途徑的唯一辦法是通過(guò)跟蹤從中間代謝物到最終產(chǎn)物過(guò)程中示蹤劑的消耗,”Fischer解釋道。“VistaFlux能將數(shù)據(jù)分析時(shí)間從手工處理的數(shù)周縮短到幾個(gè)小時(shí),同時(shí)增加了可檢測(cè)的代謝產(chǎn)物的數(shù)量。”
 
對(duì)于一個(gè)完全依賴代謝組學(xué)的解決方案,科學(xué)家可以聯(lián)用安捷倫科技公司的1290 UHPLC系統(tǒng)和6470 Triple Quadrupole液相色譜 / 質(zhì)譜系統(tǒng),并使用安捷倫科技公司的dMRM代謝組數(shù)據(jù)庫(kù)和方法,該平臺(tái)可以測(cè)量21種代謝物。
 
其他公司也為科學(xué)家提供了更多的分析選項(xiàng)。例如,賽默飛世爾科技公司的HRAM Orbitrap-based質(zhì)譜系統(tǒng)能夠在不到一小時(shí)時(shí)間內(nèi)從幾微升的人血漿中檢測(cè)多達(dá)1000個(gè)代謝產(chǎn)物。“對(duì)于高通量非靶向分析來(lái)說(shuō),”Huhmer說(shuō),“賽默飛世爾科技公司的Q Exactive質(zhì)譜,配合色譜分離(包括離子色譜和氣相色譜)的廣度可以在代謝組中檢測(cè)解析多種化學(xué)組分。”該技術(shù)能夠與賽默飛世爾科技公司的Compound Discoverer軟件聯(lián)用,可以充滿信心地將數(shù)據(jù)轉(zhuǎn)變成有意義的結(jié)果,Huhmer表示。
 
系統(tǒng)水平上的綜合
 
為了理解代謝產(chǎn)物的系統(tǒng)生物學(xué),或它們是如何一起作用的,科學(xué)家必須將這些通路聯(lián)系起來(lái),這正是基于云的XCMS在線平臺(tái)的目的。“只需要點(diǎn)一下鼠標(biāo),你就能從液相色譜 / 質(zhì)譜系統(tǒng)的反應(yīng)中得到需要的數(shù)據(jù),去除那些預(yù)測(cè)為異常的通路,”XCMS在線平臺(tái)的創(chuàng)始人Gary Siuzdak解釋道,他是位于加州拉荷亞市的斯克里普斯研究所代謝組學(xué)中心的主任和教授。“它還可以將蛋白質(zhì)組和基因組數(shù)據(jù)集成在分析中。”該平臺(tái)提供了多重水平的驗(yàn)證。
 
最重要的是,XCMS在線平臺(tái)可以輕松地瀏覽結(jié)果。例如,它創(chuàng)建了一種通路云圖,是由通路構(gòu)成的代謝物交互圖。通過(guò)單擊通路的氣泡就可以提供通路的名稱、與之關(guān)聯(lián)或不相關(guān)的代謝產(chǎn)物、相關(guān)的統(tǒng)計(jì)數(shù)據(jù)以及更多。
 
已經(jīng)有超過(guò)14000名的科學(xué)家使用了XCMS在線平臺(tái),該平臺(tái)可以讓他們進(jìn)行分析并共享結(jié)果,因?yàn)樗腔谠朴?jì)算的技術(shù)。“我們已經(jīng)看到來(lái)自每個(gè)大陸——甚至包括南極洲——的使用者,”Siuzdak說(shuō)。
 
隨著分析設(shè)備的不斷完善,生物信息系統(tǒng)功能的日益強(qiáng)大,還更容易使用,系統(tǒng)生物學(xué)方法將延伸到更多的領(lǐng)域。“系統(tǒng)生物學(xué)中這一強(qiáng)烈的趨勢(shì)正在愈發(fā)明朗,”德國(guó)亥姆霍茲聯(lián)合會(huì)計(jì)算生物學(xué)研究所主任Fabian Theis說(shuō),“并且醫(yī)學(xué)研究正在產(chǎn)生大量的‘組學(xué)度量’。”
 
代謝產(chǎn)物在一天中會(huì)產(chǎn)生波動(dòng),血液是追蹤變異的良好樣本。觀測(cè)來(lái)自大量病人同類(lèi)群的血液樣本是特別有趣的。Theis 說(shuō),“由此,我們可以整合各種‘組學(xué)’,建立網(wǎng)絡(luò),然后將它們與同類(lèi)群或臨床試驗(yàn)進(jìn)行關(guān)聯(lián)。”
 
亥姆霍茲聯(lián)合會(huì)專(zhuān)門(mén)研究這些大的同類(lèi)群。他們使用質(zhì)譜技術(shù)測(cè)量了幾千名患者的代謝物,然后將代謝物濃度與單核苷酸多態(tài)性(SNPs)相匹配。“你通常發(fā)現(xiàn)數(shù)十或數(shù)百個(gè)代謝物與SNPs關(guān)聯(lián),如果你把某個(gè)SNP與兩個(gè)代謝物的比例相關(guān),這兩個(gè)代謝物在一個(gè)生化途徑中相鄰或產(chǎn)生反應(yīng),你就可以看到這個(gè)SNP對(duì)該反應(yīng)的效果,”Theis解釋道。“例如,我們可以選擇健康和疾病組,或更簡(jiǎn)單的表型,如男性和女性,回答我們是否找到這組變量的代謝足跡。
 
然而,這些數(shù)據(jù)不能提供易于解釋的結(jié)果。許多關(guān)聯(lián)來(lái)自于間接效應(yīng),因?yàn)橥分械哪撤N反應(yīng)可能會(huì)對(duì)其他反應(yīng)產(chǎn)生深遠(yuǎn)的影響。通過(guò)計(jì)算和統(tǒng)計(jì)工具,Theis及其同事在清除了所有其他影響之后,將兩個(gè)代謝物進(jìn)行了關(guān)聯(lián)。“隨后,這個(gè)相關(guān)性表現(xiàn)出清晰的途徑,”Theis 說(shuō),“然后你就可以進(jìn)行跨疾病的比較。”
 
隨著科學(xué)家和生產(chǎn)商開(kāi)發(fā)更多的工具來(lái)更詳細(xì)地分析代謝組學(xué),我們將更多地了解生物系統(tǒng)——它們?nèi)绾卧诮】岛图膊顟B(tài)中起作用,以及它們?nèi)绾坞S著時(shí)間和環(huán)境的變化而改變。這其中的關(guān)鍵在于更多的以收集更大量的數(shù)據(jù)集為中心,并與世界各地的科學(xué)家分享這些數(shù)據(jù)!
 
(譯者高大海是中國(guó)科學(xué)院海洋研究所助理研究員)
  
Mike May是佛羅里達(dá)州的自由作家和編輯。。
DOI: 10.1126/science.opms.p1700115
鳴謝:“原文由美國(guó)科學(xué)促進(jìn)會(huì)(www.aaas.org)發(fā)布在2017年5月12日《科學(xué)》雜志”。官方英文版請(qǐng)見(jiàn)http://www.sciencemag.org/features/2017/05/big-data-big-picture-metabolomics-meets-systems-biology。
 
《科學(xué)新聞》 (科學(xué)新聞2018年5月刊 科學(xué)·生命)
發(fā)E-mail給:      
| 打印 | 評(píng)論 |