http://m.casecurityhq.com 2023-04-25 10:01 來源:鈦媒體
AI熱潮,算力概念乘風而上。近日,“我國算力總規(guī)模全球第二”的話題熱度不斷飆升。
工信部4月11日公布的數(shù)據(jù)顯示,截至去年底,我國算力總規(guī)模達到180百億億次浮點運算/秒,存力總規(guī)模超過1000EB (1萬億GB)。國家樞紐節(jié)點間的網(wǎng)絡單向時延降低到20毫秒以內(nèi),算力核心產(chǎn)業(yè)規(guī)模達到1.8萬億元。中國信息通信研究院測算,算力每投入1元,將帶動3至4元的GDP經(jīng)濟增長。
不過,上述數(shù)據(jù)中的“算力”只是一個籠統(tǒng)的算力概念,實際上根據(jù)不同應用領域分類,算力可以被分為基礎算力、智能算力和超算算力。在產(chǎn)業(yè)數(shù)字化進程中,各行業(yè)轉(zhuǎn)型升級需要大量且不同類型的算力支撐,這其中超算憑借強大的計算性能,在尖端科學領域,比如行星模擬、藥物分子設計、基因分析、高端制造等等,逐漸成為最優(yōu)解。
超算被熟知,很大程度上與超算原來越“普惠”的市場化進展有關。鈦媒體App了解到,與以往服務于高精尖科研項目的尖端超算不同,如今,超算逐漸演化出通用超算和行業(yè)超算,進一步的分化和場景上的針對性,以及將超算搬上云端的服務模式,讓超算開始為大眾與中小微企業(yè)服務。
超算的“最后一公里”
超算普惠,一是要“可用”,二是要“好用”。
通用超算和行業(yè)超算的分化只是讓超算走下神壇,“可用”問題被解決。但要解決“好用”,最關鍵的要解決超算資源有限而造成的“用超算,先排隊”的問題,同時再把超算的成本打下來。多種因素促成下,超算云服務化進入公眾視野。
與傳統(tǒng)超算用戶自己購買設備、自己建機房、自己運維相比,超算云化有明顯的性價比優(yōu)勢。同時,算云融合,也很大程度上降低了廣大科研和企業(yè)用戶使用超算的成本。但在實際落地過程中,由于目前國內(nèi)各個超算中心的算力資源配置不一樣,應用軟件使用不一樣,每個用戶對計算效率的要求也不一樣,導致用戶使用算力還面臨著資源選型困難、性能移植部署困難、技術(shù)獲取服務困難等各類問題。
也就是說,當用戶想使用超算的時候,通過什么樣的軟件調(diào)取超算資源實際上也不是一件容易事,超算普惠的最后一公里,讓超算“可用”和“好用”,還需要再超算平臺與實際用戶之間構(gòu)建一個繁榮多元的超算軟件生態(tài)。
“從真實應用運行特征入手,綜合考慮不同應用場景下各類算力資源和應用計算的性能表現(xiàn),再通過對各類應用的精細化分析,為不同用戶選擇更適合的應用程序。”北京超算(北京超級云計算中心簡稱)技術(shù)總監(jiān)甄亞楠對鈦媒體App表示。
北京超算的實踐經(jīng)驗是將解決方案具體細化,只有打通了超算軟件應用生態(tài)的最后一公里,進一步才是向企業(yè)級用戶提供一些定制化的算力服務。“包括算力資源、網(wǎng)絡資源、存儲資源的定制。”甄亞楠說。
不過,有意無意間,在構(gòu)建一個多元的超算軟件生態(tài)的過程中,“工業(yè)軟件”成為了超算場景下成長最快的應用類型。
超算上長出“工業(yè)軟件”
工業(yè)軟件被卡脖子,這是個被詬病已久的問題。在陸陸續(xù)續(xù)海外工業(yè)軟件停服的案例曝出之后,加大中國工業(yè)軟件的創(chuàng)新速度,就成為了一件非常迫切的事情。而超算與工業(yè)軟件的化學反應,也在這一過程中產(chǎn)生。
論應用,工業(yè)軟件的研發(fā)實踐需要大量的高性能計算來輔助,它與超算能稱得上天然適配。近年來,我國的工業(yè)軟件領域時常面臨“卡脖子”問題,“打好科技儀器設備、操作系統(tǒng)和基礎軟件國產(chǎn)化攻堅戰(zhàn)”也被點名提出,因此,我國超算服務商也在逐漸走上助力國產(chǎn)工業(yè)軟件的道路。
助力國產(chǎn)工業(yè)軟件,首先是幫助其上“云”,建立算力供應鏈,借助超算云服務化模式,在提供大量高性能的算力資源的同時,還能充分發(fā)揮算云融合優(yōu)勢。
但這一過程,具體是怎么有效落地的呢?
鈦媒體App了解到,最重要的是算力供應鏈的建立。通過幫助國產(chǎn)工業(yè)軟件實現(xiàn)上云,能夠使產(chǎn)業(yè)鏈上各企業(yè)、部門進行高效協(xié)作,共同達成智能供應鏈協(xié)同;通過保穩(wěn)算力供應鏈,超算平臺從對接算力用戶到對接國產(chǎn)軟件研發(fā)團隊,充分發(fā)揮橋梁作用。
而提到保穩(wěn)供應鏈,其實就是供應鏈安全性問題。鈦媒體App了解到,北京超算主要是從保障算力供應鏈以及保障軟件供應鏈兩方面入手,來提升算力服務的支撐能力:
在保障算力供應的安全方面,現(xiàn)在北京超算擁有國內(nèi)最大的通用算力資源池,同時也引入了百PFlops的國產(chǎn)算力資源,可以實現(xiàn)國產(chǎn)算力有效替代,滿足不同用戶的算力需求;
在保障軟件供應鏈方面:北京超算將國產(chǎn)算力資源帶入到國產(chǎn)應用軟件生產(chǎn)和研發(fā)的關鍵環(huán)節(jié),來保障軟件供應鏈安全;目前,其平臺已經(jīng)部署了超過200款的通用計算軟件,還有覆蓋工業(yè)仿真、材料計算、生命科學等細分領域超過30款的國產(chǎn)工業(yè)軟件。
甄亞楠表示,許多軟件在研發(fā)之初都已經(jīng)開始考慮直接基于云上的環(huán)境進行安裝和部署,相對于傳統(tǒng)的比如刻光盤或者刻優(yōu)盤去賣軟件的方式,云端共享軟件的模式更為靈活。“尤其是國產(chǎn)工業(yè)軟件云化,能夠搭載互聯(lián)網(wǎng)優(yōu)勢,使用戶快速、及時地獲取國產(chǎn)工業(yè)軟件的最新功能信息。此外,國產(chǎn)工業(yè)軟件上云也會加速軟件的開發(fā)迭代,通過云化的服務模式開拓出更多的部署環(huán)境。”甄亞楠說到。
不過,幫助工業(yè)軟件云化和保障算力供應鏈安全只是其一,隨著AI時代的加速到來,不只是超算,未來工業(yè)軟件對AI算力或者說智能算力的需求也會逐漸加大,大量的工業(yè)類數(shù)據(jù)需要分析和價值挖掘,超算平臺在塑造多元軟件生態(tài)的過程中,這一趨勢也不得不考慮。
根據(jù)中國信息通信研究院發(fā)布的《中國算力發(fā)展指數(shù)白皮書(2022年)》,2021年全球計算設備算力總規(guī)模達到615EFlops,同比增長44%,其中智能算力規(guī)模為232EFlops,超級算力規(guī)模為14EFlops;2021年中國算力總規(guī)模達到202EFlops,其中智能算力規(guī)模達104EFlops,增速85%,占比超過50%;預計2030年全球算力規(guī)模達到56ZFlops,平均年增速達到65%。
甄亞楠介紹,針對ChatGPT一類的大語言模型,考慮到其強勁的算力需求以及預訓練模型的數(shù)據(jù)處理需要,目前北京超算已經(jīng)具備了百卡、千卡規(guī)模的算力服務能力。此外,北京超算在積極尋求與國內(nèi)頂尖研究機構(gòu)的合作,通過集成部署通用框架、自研算法等方式來滿足算力需要。截至目前,北京超算已經(jīng)部署了如A100、V100等在內(nèi)的多種GPU芯片,以及優(yōu)化部署了一批常用的深度學習框架。
回歸應用,甄亞楠表示,在人工智能場景中,北京超算一方面建設以GPU或加速卡為代表的算力資源,幫助加速科學計算以及人工智能計算結(jié)果生成。另一方面,面向推理場景,通過建設大量基于云計算的云主機資源,幫助用戶順利開展在線推理業(yè)務。
基于超算云服務化模式,算力市場還有很大的拓展空間,北京超算助力國產(chǎn)工業(yè)軟件的實踐效果還有待驗證。而AI帶動的萬億藍海,就在那里,依舊波濤洶涌。