作者:李國杰 來源: 發(fā)布時間:2022-11-1 22:59:8
算力網(wǎng)絡(luò)前景光明、挑戰(zhàn)巨大

   信息社會進入智能化新階段,信息基礎(chǔ)設(shè)施的主要作用已不是解決連通問題,而是為人類的生產(chǎn)與生活提供充分的分析、判斷和控制能力。因此,計算能力和大數(shù)據(jù)資源成了新的信息基礎(chǔ)設(shè)施的關(guān)鍵。算力作為數(shù)字經(jīng)濟時代的新生產(chǎn)力,必須實現(xiàn)基礎(chǔ)設(shè)施化。

   算力和國內(nèi)生產(chǎn)總值(GDP)呈正相關(guān)的關(guān)系,未來算力指數(shù)可能是比電力指數(shù)更重要的經(jīng)濟指標。因此,未來信息基礎(chǔ)設(shè)施必須通盤考慮算力網(wǎng)絡(luò)和通信網(wǎng),還要與電力等能源網(wǎng)絡(luò)協(xié)同配合,做好算力、通信、電力網(wǎng)全國“一盤棋”的頂層設(shè)計,統(tǒng)籌兼顧,力爭全局優(yōu)化。

   算力網(wǎng)絡(luò)是新型基礎(chǔ)設(shè)施的一個組成部分,而“東數(shù)西算”又是算力網(wǎng)絡(luò)的一個組成部分。我們要基于經(jīng)濟社會發(fā)展的大邏輯、大格局、大趨勢,做好頂層路線圖的設(shè)計,避免“只見樹木不見森林”。

 

不同視角下的未來信息基礎(chǔ)設(shè)施

 

   計算機界和通信界對未來的信息基礎(chǔ)設(shè)施有著不同的視角。

   計算思維的核心是分層次抽象,對應(yīng)到未來信息基礎(chǔ)設(shè)施,就是以新的抽象來屏蔽不同“云”的差異,實現(xiàn)“跨云計算”。眾所周知,互聯(lián)網(wǎng)是網(wǎng)際網(wǎng),未來的信息基礎(chǔ)設(shè)施就是“互聯(lián)云”。

   從計算機的視角來看,這是以云為中心,強調(diào)以云調(diào)網(wǎng)、云網(wǎng)融合、一云多網(wǎng)的信息基礎(chǔ)設(shè)施,重點是解決各種軟硬件的不兼容問題。算力網(wǎng)絡(luò)基本載荷單元不是消息,而是計算任務(wù)。核心創(chuàng)新是做任務(wù)交換和高通量的計算,追求低熵有序。

   而通信界的視角則是以網(wǎng)絡(luò)為中心,把計算和存儲能力看成是可調(diào)動的資源,即“網(wǎng)調(diào)云”,因而強調(diào)算力資源評估、交易和調(diào)度,目標是構(gòu)建網(wǎng)絡(luò)和計算高效協(xié)同的網(wǎng)絡(luò)架構(gòu)。新的網(wǎng)絡(luò)架構(gòu)重視算力的感知、異構(gòu)算力的統(tǒng)一標識和算力資源的標準化等。

   目前,算力網(wǎng)絡(luò)被認為是6G與未來網(wǎng)絡(luò)中一項重要的基礎(chǔ)技術(shù),即在網(wǎng)絡(luò)中部署數(shù)據(jù)處理能力。這一理念目前主要是電信運營商在推動,中國電信等運營商先后發(fā)布了《算力網(wǎng)絡(luò)白皮書》,也提出了國際標準。2021年7月,國際電信聯(lián)盟電信標準分局(ITU-T)發(fā)布了第一個算力網(wǎng)絡(luò)技術(shù)的國際標準“Y.2501”。算力網(wǎng)絡(luò)的提出不僅僅是技術(shù)發(fā)展趨勢,更是市場競爭的需求。電信運營商希望在“連接+計算”一體化服務(wù)場景下實現(xiàn)業(yè)務(wù)擴展,避免被管道化。

   工信部通信科技委常務(wù)副主任、中國電信科技委主任韋樂平曾提出“網(wǎng)是基礎(chǔ)、云為核心、網(wǎng)隨云動、云網(wǎng)一體”,我認為這是云網(wǎng)融合一個正確的發(fā)展原則。我希望通信領(lǐng)域的專家考慮“網(wǎng)調(diào)云”的時候,要充分理解哪些計算資源現(xiàn)在可以通過網(wǎng)絡(luò)進行調(diào)配、哪些還不能。實際情況是,目前只有相當少量的計算資源可以調(diào)配,很多還不能調(diào)配。

 

算力網(wǎng)絡(luò)是前景光明的宏偉目標 

 

   “人工智能之父”約翰•麥卡錫早在1961年就提出效用計算(Utility Computing)的目標:“有一天,計算可能會被組織成一個公共事業(yè),就像電話系統(tǒng)是一個公共事業(yè)一樣。”讓計算能力成為像電一樣的公共基礎(chǔ)設(shè)施,這是計算機界已經(jīng)奮斗了半個多世紀的宏偉目標。1984年,SUN公司提出的“網(wǎng)絡(luò)就是計算機”也是今天講的算力網(wǎng)絡(luò)的美妙前景。

   從提出Utility Computing的奮斗目標開始,計算機界就清楚公共計算服務(wù)與公共電網(wǎng)不同,至少需要關(guān)注三個問題。一是接口——用戶如何和資源進行對接?二是服務(wù)設(shè)備——用戶通過什么設(shè)備將資源轉(zhuǎn)換成服務(wù)?三是產(chǎn)品的異質(zhì)性——計算是一種復雜的服務(wù),存在多樣性,不同的編程語言和硬件如何兼容?通過幾十年的努力,人們已經(jīng)發(fā)明了用于遠程接入的互聯(lián)網(wǎng)、管理物理計算資源的操作系統(tǒng)、把資源分給多人同時使用的虛擬化技術(shù)。近十年廣泛流行的云計算集成了這些技術(shù),為實現(xiàn)“計算的公共基礎(chǔ)設(shè)施”找到了出路。只要云、邊、網(wǎng)、端都盡可能地實現(xiàn)云化,就有可能將原本不是公共物品的計算能力變成虛擬的公共物品。從長遠目標來看,算力網(wǎng)絡(luò)的前景一定是光明的。

 

算力資源還需大量原始創(chuàng)新

 

   媒體上有些文章將目前在做的算力網(wǎng)絡(luò)與交通網(wǎng)絡(luò)、電力網(wǎng)絡(luò)等量齊觀,認為算力現(xiàn)在就可以做到像供水和供電一樣方便,這顯然太樂觀了。計算能力終究不是像水電一樣具有同質(zhì)性的公共品,每個算力產(chǎn)品都想通過專有的特性贏得競爭,所以算力網(wǎng)絡(luò)的實現(xiàn)比交通和能源網(wǎng)絡(luò)復雜得多也困難得多。構(gòu)建算力網(wǎng)絡(luò)的技術(shù)還不成熟,還需要做很多基礎(chǔ)性的原始創(chuàng)新和大量的技術(shù)攻關(guān)。

   正在研究突破的與算力網(wǎng)絡(luò)有關(guān)的計算技術(shù)包括任務(wù)交換技術(shù)、智能流抽象、資源賦名、控域、網(wǎng)程、標簽化體系結(jié)構(gòu)、內(nèi)構(gòu)安全、在網(wǎng)計算等等,突破這些技術(shù)都需要付出艱苦的努力。通信與網(wǎng)絡(luò)界也要突破許多關(guān)鍵技術(shù),其中確定性網(wǎng)絡(luò)對實現(xiàn)性能與用戶體驗可控的算力網(wǎng)絡(luò)具有重要意義。

 

算力網(wǎng)絡(luò)要為減熵作貢獻

 

   傳統(tǒng)的“信息高速公路”的技術(shù)天花板已出現(xiàn)。“信息高速公路”遵循“無序共享”原則,這一原則為現(xiàn)有的信息基礎(chǔ)設(shè)施埋下了巨大隱患——性能干擾,用戶可感知的服務(wù)質(zhì)量存在很大的不確定性(從信息論的角度看就是“熵”比較大)。由于采用大量冗余,各大云計算中心均面臨總體效率不高的問題,許多數(shù)據(jù)中心的利用率甚至不到20%。因此,在計算機界人士的眼中,算力網(wǎng)絡(luò)作為未來網(wǎng)絡(luò)的組成部分,要為減熵作貢獻。

   中國科學院計算技術(shù)研究所(以下簡稱計算所)提出的“信息高鐵”就是建設(shè)高通量低熵算力網(wǎng)絡(luò)。“信息高鐵”強調(diào)“低熵有序”,針對高通量計算,其性能指標是“通量”(goodput,通量=任務(wù)吞吐率×良率),即“保質(zhì)任務(wù)吞吐率”,也就是單位時間完成的保質(zhì)任務(wù)數(shù)。“信息高鐵”追求的目標是可測、可控、可調(diào)、可信,希望能顯著改善應(yīng)用品質(zhì),提升系統(tǒng)通量與效率。

   “信息高鐵”按照“一橫一縱”的思路,重新定義下一代信息基礎(chǔ)設(shè)施的邊界。“一橫”是通過“聯(lián)邦制”的方式橫向聯(lián)通,最大化組織起所有愿意共享的大/小數(shù)據(jù)中心的各類異構(gòu)算力資源,為用戶提供統(tǒng)一封裝、抽象易用的算力資源;“一縱”是縱向打通云、網(wǎng)、邊、端全鏈路基礎(chǔ)設(shè)施資源,通過全鏈路多級多維度測調(diào)、控域隔離等方式,實現(xiàn)海量物端應(yīng)用的端到端服務(wù)確保質(zhì)量。

   計算所對“信息高鐵”做了初步的測試實驗,結(jié)果表明,不管是任務(wù)的良率還是通量,都比傳統(tǒng)互聯(lián)網(wǎng)高出6~7倍。而且,越是負載高的時候,“信息高鐵”的優(yōu)勢越明顯,良率也是如此。

 

算力網(wǎng)絡(luò)要避免“帝國制”壟斷運營

 

   從頂層設(shè)計的角度,我認為國家算力網(wǎng)絡(luò)的建設(shè)應(yīng)由三部分組成。第一部分是由國家或地方財政建立的公共算力基礎(chǔ)設(shè)施,第二部分是電信運營商和龍頭云服務(wù)商建設(shè)的骨干企業(yè)級算力基礎(chǔ)設(shè)施,第三部分是由大量中小型信息服務(wù)企業(yè)協(xié)作建立的算力網(wǎng)絡(luò)。

   算力網(wǎng)絡(luò)的構(gòu)建要高度重視中小企業(yè)。我希望全國的算力網(wǎng)絡(luò)避免單一“帝國制”壟斷運營,探索新型的“聯(lián)邦制”管理模式,激活中小企業(yè)的參與熱情。運行方式是否得當,決定著算力網(wǎng)絡(luò)的前途。

   在布局上,算力網(wǎng)絡(luò)既要“全局統(tǒng)一”,又要“環(huán)節(jié)解耦”。“全局統(tǒng)一”是指全國主要算力中心協(xié)同管理,形成東西互補、南北貫通的一體化算力網(wǎng)絡(luò),提供統(tǒng)一的算力資源服務(wù)。“環(huán)節(jié)解耦”是指算力的設(shè)備提供商、運營商和增值服務(wù)商合理解耦,消費者僅需按統(tǒng)一定價支付費用就可得到多樣性服務(wù)。在我看來,算力網(wǎng)絡(luò)的生命力在于協(xié)同合作,過分強調(diào)一家企業(yè)的端到端一體化,不利于算力網(wǎng)絡(luò)的發(fā)展。

   計算的應(yīng)用可分為實時(數(shù)據(jù)處理)和非實時兩大類。一般而言,有實時要求的應(yīng)用并不要求很強大的算力,但那些面向基礎(chǔ)研究的科學計算、人工智能的訓練等,雖不要求實時的應(yīng)用,往往需要使用超級計算機和超大規(guī)模的人工智能訓練平臺。

   新藥研制和新材料研發(fā)、集成電路等新產(chǎn)品的設(shè)計等,都需要巨大的算力。非實時的計算可能對國家發(fā)展具有更基礎(chǔ)、更長遠的作用,國家級的算力網(wǎng)絡(luò)資源應(yīng)優(yōu)先考慮非實時的高性能計算和智能計算(模型的訓練)。實時性強的工業(yè)互聯(lián)網(wǎng)和金融網(wǎng)絡(luò)等大多由企業(yè)自建。此外,邊緣計算和物聯(lián)網(wǎng)大多有實時要求,算力網(wǎng)絡(luò)建設(shè)要高度重視確定性網(wǎng)絡(luò)的研究。

 

不能無限夸大“東數(shù)西算”的減排貢獻

 

   啟動“東數(shù)西算”工程,有利于集中建設(shè)數(shù)據(jù)通信網(wǎng)絡(luò),促進我國西部地區(qū)的數(shù)字經(jīng)濟發(fā)展,能在一定程度上緩解東部供電壓力。但是,放在全國的大盤子上,“東數(shù)西算”工程對全國節(jié)能減排只有一定比例的貢獻,不能無限制地夸大。

   數(shù)字中心只要建了,不管建在東部還是西部,都是要耗電的。在西部建數(shù)據(jù)中心有兩方面的好處。

   一是西部的電源使用效率(PUE)值低一點,相對于在東部建數(shù)據(jù)中心,有可能會節(jié)省20%的用電。但如果采用曙光公司發(fā)明的浸沒相變液冷技術(shù),耗電量對數(shù)據(jù)中心所在地的平均氣溫就不是十分敏感。

   二是傳輸線路的損耗,2000公里長距離輸電的損耗在6%左右。根據(jù)中國信息通信研究院統(tǒng)計的各省區(qū)市2020年的算力規(guī)模,貴州、甘肅、寧夏、新疆、重慶等西部各省區(qū)市算力總和還不到5Eflops,只占我國數(shù)據(jù)中心算力總規(guī)模(140Eflops)的4%左右。即使未來幾年翻倍增長,估計西部新建數(shù)據(jù)中心的算力5年內(nèi)也難以超過全國算力的20%。

   全國數(shù)據(jù)中心每年耗電量在2000億度左右,未來西部數(shù)據(jù)中心最多用電120億度。能節(jié)省120億度電當然是值得努力爭取的大事,但與我國總用電量8萬億度相比,只占0.15%。與每年跨省輸電2萬億度相比,也只有“西電東輸”的0.6%。

   因此“東數(shù)西算”的意義不能光拿省電來說事,也不能把“東數(shù)西算”看作是我國算力基礎(chǔ)設(shè)施的整體戰(zhàn)略和全部內(nèi)容,應(yīng)從國家東西部平衡發(fā)展、構(gòu)建全國算力網(wǎng)絡(luò)新基礎(chǔ)設(shè)施的大局著眼。目前東部大城市建數(shù)據(jù)中心的需求很迫切,但沒有用電指標,批地也很困難,向西部尋求算力資源是迫切而合理的選擇。

   需要指出的是,我國現(xiàn)行的《供電營業(yè)規(guī)則》不允許光伏和風力發(fā)電站直接給數(shù)據(jù)中心供電——發(fā)電必須入網(wǎng),電力統(tǒng)購統(tǒng)銷。這種政策不利于在西部建設(shè)數(shù)據(jù)中心。建議國家給數(shù)據(jù)中心一定的靈活性,推行“源網(wǎng)荷儲一體化”理念,支持算力跟著能源走,促進綠電的消納。

 

取得實效尚需艱苦努力

 

   另外值得注意的是,雖然中西部地區(qū)數(shù)據(jù)中心在用機架數(shù)的全國占比已上升到39%,超過北京、上海、廣東三個數(shù)據(jù)中心聚集區(qū)的在用機架數(shù)的全國占比(31%),但機器利用率不高。“東數(shù)西算”工程在西部建設(shè)的四個數(shù)據(jù)中心基地如何開展業(yè)務(wù)、大幅度提高算力的利用率,要做大量細致的工作。“東數(shù)西算”要達到“西電東輸”和“南水北調(diào)”的實效,還要做艱苦的努力。

   美國擁有多個開放的、全球性的、與算力網(wǎng)絡(luò)有關(guān)的科研創(chuàng)新綜合試驗平臺,它們?yōu)槊绹畔㈩I(lǐng)域科研創(chuàng)新提供了肥沃的土壤。而我國現(xiàn)在僅有一個國家級的未來網(wǎng)絡(luò)實驗平臺,先進算力、分布式系統(tǒng)、云計算、邊緣計算等領(lǐng)域的國家級科研試驗平臺還處于空白狀態(tài)。

   建議國家盡快成立算力基礎(chǔ)設(shè)施研究中心和“東數(shù)西算”工程技術(shù)的試驗場,建設(shè)一些開放性的平臺。這些平臺不能是一個“孤島”,應(yīng)該與現(xiàn)有網(wǎng)絡(luò)系統(tǒng)互聯(lián)互通,研發(fā)面向“東數(shù)西算”的“聯(lián)邦制”管理、算力測調(diào)和撮合交易系統(tǒng)等,形成算力基礎(chǔ)設(shè)施化的核心技術(shù)、基礎(chǔ)軟件和關(guān)鍵系統(tǒng),并向“東數(shù)西算”工程推廣,加快各環(huán)節(jié)關(guān)鍵技術(shù)從孵化到完善的全過程,最終形成一套可面向“一帶一路”推廣的新信息技術(shù)體系。■

(作者系中國工程院院士、中國計算機學會名譽理事長,記者趙廣立根據(jù)其在信息化百人會第八屆信息戰(zhàn)略論壇上的發(fā)言整理)

 

《科學新聞》 (科學新聞2022年10月刊 封面)
發(fā)E-mail給:      
| 打印 | 評論 |