http://m.casecurityhq.com 2023-04-25 10:01 來(lái)源:鈦媒體
AI熱潮,算力概念乘風(fēng)而上。近日,“我國(guó)算力總規(guī)模全球第二”的話題熱度不斷飆升。
工信部4月11日公布的數(shù)據(jù)顯示,截至去年底,我國(guó)算力總規(guī)模達(dá)到180百億億次浮點(diǎn)運(yùn)算/秒,存力總規(guī)模超過(guò)1000EB (1萬(wàn)億GB)。國(guó)家樞紐節(jié)點(diǎn)間的網(wǎng)絡(luò)單向時(shí)延降低到20毫秒以?xún)?nèi),算力核心產(chǎn)業(yè)規(guī)模達(dá)到1.8萬(wàn)億元。中國(guó)信息通信研究院測(cè)算,算力每投入1元,將帶動(dòng)3至4元的GDP經(jīng)濟(jì)增長(zhǎng)。
不過(guò),上述數(shù)據(jù)中的“算力”只是一個(gè)籠統(tǒng)的算力概念,實(shí)際上根據(jù)不同應(yīng)用領(lǐng)域分類(lèi),算力可以被分為基礎(chǔ)算力、智能算力和超算算力。在產(chǎn)業(yè)數(shù)字化進(jìn)程中,各行業(yè)轉(zhuǎn)型升級(jí)需要大量且不同類(lèi)型的算力支撐,這其中超算憑借強(qiáng)大的計(jì)算性能,在尖端科學(xué)領(lǐng)域,比如行星模擬、藥物分子設(shè)計(jì)、基因分析、高端制造等等,逐漸成為最優(yōu)解。
超算被熟知,很大程度上與超算原來(lái)越“普惠”的市場(chǎng)化進(jìn)展有關(guān)。鈦媒體App了解到,與以往服務(wù)于高精尖科研項(xiàng)目的尖端超算不同,如今,超算逐漸演化出通用超算和行業(yè)超算,進(jìn)一步的分化和場(chǎng)景上的針對(duì)性,以及將超算搬上云端的服務(wù)模式,讓超算開(kāi)始為大眾與中小微企業(yè)服務(wù)。
超算的“最后一公里”
超算普惠,一是要“可用”,二是要“好用”。
通用超算和行業(yè)超算的分化只是讓超算走下神壇,“可用”問(wèn)題被解決。但要解決“好用”,最關(guān)鍵的要解決超算資源有限而造成的“用超算,先排隊(duì)”的問(wèn)題,同時(shí)再把超算的成本打下來(lái)。多種因素促成下,超算云服務(wù)化進(jìn)入公眾視野。
與傳統(tǒng)超算用戶(hù)自己購(gòu)買(mǎi)設(shè)備、自己建機(jī)房、自己運(yùn)維相比,超算云化有明顯的性?xún)r(jià)比優(yōu)勢(shì)。同時(shí),算云融合,也很大程度上降低了廣大科研和企業(yè)用戶(hù)使用超算的成本。但在實(shí)際落地過(guò)程中,由于目前國(guó)內(nèi)各個(gè)超算中心的算力資源配置不一樣,應(yīng)用軟件使用不一樣,每個(gè)用戶(hù)對(duì)計(jì)算效率的要求也不一樣,導(dǎo)致用戶(hù)使用算力還面臨著資源選型困難、性能移植部署困難、技術(shù)獲取服務(wù)困難等各類(lèi)問(wèn)題。
也就是說(shuō),當(dāng)用戶(hù)想使用超算的時(shí)候,通過(guò)什么樣的軟件調(diào)取超算資源實(shí)際上也不是一件容易事,超算普惠的最后一公里,讓超算“可用”和“好用”,還需要再超算平臺(tái)與實(shí)際用戶(hù)之間構(gòu)建一個(gè)繁榮多元的超算軟件生態(tài)。
“從真實(shí)應(yīng)用運(yùn)行特征入手,綜合考慮不同應(yīng)用場(chǎng)景下各類(lèi)算力資源和應(yīng)用計(jì)算的性能表現(xiàn),再通過(guò)對(duì)各類(lèi)應(yīng)用的精細(xì)化分析,為不同用戶(hù)選擇更適合的應(yīng)用程序。”北京超算(北京超級(jí)云計(jì)算中心簡(jiǎn)稱(chēng))技術(shù)總監(jiān)甄亞楠對(duì)鈦媒體App表示。
北京超算的實(shí)踐經(jīng)驗(yàn)是將解決方案具體細(xì)化,只有打通了超算軟件應(yīng)用生態(tài)的最后一公里,進(jìn)一步才是向企業(yè)級(jí)用戶(hù)提供一些定制化的算力服務(wù)。“包括算力資源、網(wǎng)絡(luò)資源、存儲(chǔ)資源的定制。”甄亞楠說(shuō)。
不過(guò),有意無(wú)意間,在構(gòu)建一個(gè)多元的超算軟件生態(tài)的過(guò)程中,“工業(yè)軟件”成為了超算場(chǎng)景下成長(zhǎng)最快的應(yīng)用類(lèi)型。
超算上長(zhǎng)出“工業(yè)軟件”
工業(yè)軟件被卡脖子,這是個(gè)被詬病已久的問(wèn)題。在陸陸續(xù)續(xù)海外工業(yè)軟件停服的案例曝出之后,加大中國(guó)工業(yè)軟件的創(chuàng)新速度,就成為了一件非常迫切的事情。而超算與工業(yè)軟件的化學(xué)反應(yīng),也在這一過(guò)程中產(chǎn)生。
論應(yīng)用,工業(yè)軟件的研發(fā)實(shí)踐需要大量的高性能計(jì)算來(lái)輔助,它與超算能稱(chēng)得上天然適配。近年來(lái),我國(guó)的工業(yè)軟件領(lǐng)域時(shí)常面臨“卡脖子”問(wèn)題,“打好科技儀器設(shè)備、操作系統(tǒng)和基礎(chǔ)軟件國(guó)產(chǎn)化攻堅(jiān)戰(zhàn)”也被點(diǎn)名提出,因此,我國(guó)超算服務(wù)商也在逐漸走上助力國(guó)產(chǎn)工業(yè)軟件的道路。
助力國(guó)產(chǎn)工業(yè)軟件,首先是幫助其上“云”,建立算力供應(yīng)鏈,借助超算云服務(wù)化模式,在提供大量高性能的算力資源的同時(shí),還能充分發(fā)揮算云融合優(yōu)勢(shì)。
但這一過(guò)程,具體是怎么有效落地的呢?
鈦媒體App了解到,最重要的是算力供應(yīng)鏈的建立。通過(guò)幫助國(guó)產(chǎn)工業(yè)軟件實(shí)現(xiàn)上云,能夠使產(chǎn)業(yè)鏈上各企業(yè)、部門(mén)進(jìn)行高效協(xié)作,共同達(dá)成智能供應(yīng)鏈協(xié)同;通過(guò)保穩(wěn)算力供應(yīng)鏈,超算平臺(tái)從對(duì)接算力用戶(hù)到對(duì)接國(guó)產(chǎn)軟件研發(fā)團(tuán)隊(duì),充分發(fā)揮橋梁作用。
而提到保穩(wěn)供應(yīng)鏈,其實(shí)就是供應(yīng)鏈安全性問(wèn)題。鈦媒體App了解到,北京超算主要是從保障算力供應(yīng)鏈以及保障軟件供應(yīng)鏈兩方面入手,來(lái)提升算力服務(wù)的支撐能力:
在保障算力供應(yīng)的安全方面,現(xiàn)在北京超算擁有國(guó)內(nèi)最大的通用算力資源池,同時(shí)也引入了百PFlops的國(guó)產(chǎn)算力資源,可以實(shí)現(xiàn)國(guó)產(chǎn)算力有效替代,滿足不同用戶(hù)的算力需求;
在保障軟件供應(yīng)鏈方面:北京超算將國(guó)產(chǎn)算力資源帶入到國(guó)產(chǎn)應(yīng)用軟件生產(chǎn)和研發(fā)的關(guān)鍵環(huán)節(jié),來(lái)保障軟件供應(yīng)鏈安全;目前,其平臺(tái)已經(jīng)部署了超過(guò)200款的通用計(jì)算軟件,還有覆蓋工業(yè)仿真、材料計(jì)算、生命科學(xué)等細(xì)分領(lǐng)域超過(guò)30款的國(guó)產(chǎn)工業(yè)軟件。
甄亞楠表示,許多軟件在研發(fā)之初都已經(jīng)開(kāi)始考慮直接基于云上的環(huán)境進(jìn)行安裝和部署,相對(duì)于傳統(tǒng)的比如刻光盤(pán)或者刻優(yōu)盤(pán)去賣(mài)軟件的方式,云端共享軟件的模式更為靈活。“尤其是國(guó)產(chǎn)工業(yè)軟件云化,能夠搭載互聯(lián)網(wǎng)優(yōu)勢(shì),使用戶(hù)快速、及時(shí)地獲取國(guó)產(chǎn)工業(yè)軟件的最新功能信息。此外,國(guó)產(chǎn)工業(yè)軟件上云也會(huì)加速軟件的開(kāi)發(fā)迭代,通過(guò)云化的服務(wù)模式開(kāi)拓出更多的部署環(huán)境。”甄亞楠說(shuō)到。
不過(guò),幫助工業(yè)軟件云化和保障算力供應(yīng)鏈安全只是其一,隨著AI時(shí)代的加速到來(lái),不只是超算,未來(lái)工業(yè)軟件對(duì)AI算力或者說(shuō)智能算力的需求也會(huì)逐漸加大,大量的工業(yè)類(lèi)數(shù)據(jù)需要分析和價(jià)值挖掘,超算平臺(tái)在塑造多元軟件生態(tài)的過(guò)程中,這一趨勢(shì)也不得不考慮。
根據(jù)中國(guó)信息通信研究院發(fā)布的《中國(guó)算力發(fā)展指數(shù)白皮書(shū)(2022年)》,2021年全球計(jì)算設(shè)備算力總規(guī)模達(dá)到615EFlops,同比增長(zhǎng)44%,其中智能算力規(guī)模為232EFlops,超級(jí)算力規(guī)模為14EFlops;2021年中國(guó)算力總規(guī)模達(dá)到202EFlops,其中智能算力規(guī)模達(dá)104EFlops,增速85%,占比超過(guò)50%;預(yù)計(jì)2030年全球算力規(guī)模達(dá)到56ZFlops,平均年增速達(dá)到65%。
甄亞楠介紹,針對(duì)ChatGPT一類(lèi)的大語(yǔ)言模型,考慮到其強(qiáng)勁的算力需求以及預(yù)訓(xùn)練模型的數(shù)據(jù)處理需要,目前北京超算已經(jīng)具備了百卡、千卡規(guī)模的算力服務(wù)能力。此外,北京超算在積極尋求與國(guó)內(nèi)頂尖研究機(jī)構(gòu)的合作,通過(guò)集成部署通用框架、自研算法等方式來(lái)滿足算力需要。截至目前,北京超算已經(jīng)部署了如A100、V100等在內(nèi)的多種GPU芯片,以及優(yōu)化部署了一批常用的深度學(xué)習(xí)框架。
回歸應(yīng)用,甄亞楠表示,在人工智能場(chǎng)景中,北京超算一方面建設(shè)以GPU或加速卡為代表的算力資源,幫助加速科學(xué)計(jì)算以及人工智能計(jì)算結(jié)果生成。另一方面,面向推理場(chǎng)景,通過(guò)建設(shè)大量基于云計(jì)算的云主機(jī)資源,幫助用戶(hù)順利開(kāi)展在線推理業(yè)務(wù)。
基于超算云服務(wù)化模式,算力市場(chǎng)還有很大的拓展空間,北京超算助力國(guó)產(chǎn)工業(yè)軟件的實(shí)踐效果還有待驗(yàn)證。而AI帶動(dòng)的萬(wàn)億藍(lán)海,就在那里,依舊波濤洶涌。