中國自動化學會專家咨詢工作委員會指定宣傳媒體
新聞詳情
gkongbbs

超算云服務化,國產(chǎn)工業(yè)軟件的機會來了?

http://m.casecurityhq.com 2023-04-25 10:01 來源:鈦媒體

AI熱潮,算力概念乘風而上。近日,“我國算力總規(guī)模全球第二”的話題熱度不斷飆升。

工信部4月11日公布的數(shù)據(jù)顯示,截至去年底,我國算力總規(guī)模達到180百億億次浮點運算/秒,存力總規(guī)模超過1000EB (1萬億GB)。國家樞紐節(jié)點間的網(wǎng)絡單向時延降低到20毫秒以內,算力核心產(chǎn)業(yè)規(guī)模達到1.8萬億元。中國信息通信研究院測算,算力每投入1元,將帶動3至4元的GDP經(jīng)濟增長。

不過,上述數(shù)據(jù)中的“算力”只是一個籠統(tǒng)的算力概念,實際上根據(jù)不同應用領域分類,算力可以被分為基礎算力、智能算力和超算算力。在產(chǎn)業(yè)數(shù)字化進程中,各行業(yè)轉型升級需要大量且不同類型的算力支撐,這其中超算憑借強大的計算性能,在尖端科學領域,比如行星模擬、藥物分子設計、基因分析、高端制造等等,逐漸成為最優(yōu)解。

超算被熟知,很大程度上與超算原來越“普惠”的市場化進展有關。鈦媒體App了解到,與以往服務于高精尖科研項目的尖端超算不同,如今,超算逐漸演化出通用超算和行業(yè)超算,進一步的分化和場景上的針對性,以及將超算搬上云端的服務模式,讓超算開始為大眾與中小微企業(yè)服務。

超算的“最后一公里”

超算普惠,一是要“可用”,二是要“好用”。

通用超算和行業(yè)超算的分化只是讓超算走下神壇,“可用”問題被解決。但要解決“好用”,最關鍵的要解決超算資源有限而造成的“用超算,先排隊”的問題,同時再把超算的成本打下來。多種因素促成下,超算云服務化進入公眾視野。

與傳統(tǒng)超算用戶自己購買設備、自己建機房、自己運維相比,超算云化有明顯的性價比優(yōu)勢。同時,算云融合,也很大程度上降低了廣大科研和企業(yè)用戶使用超算的成本。但在實際落地過程中,由于目前國內各個超算中心的算力資源配置不一樣,應用軟件使用不一樣,每個用戶對計算效率的要求也不一樣,導致用戶使用算力還面臨著資源選型困難、性能移植部署困難、技術獲取服務困難等各類問題。

也就是說,當用戶想使用超算的時候,通過什么樣的軟件調取超算資源實際上也不是一件容易事,超算普惠的最后一公里,讓超算“可用”和“好用”,還需要再超算平臺與實際用戶之間構建一個繁榮多元的超算軟件生態(tài)。

“從真實應用運行特征入手,綜合考慮不同應用場景下各類算力資源和應用計算的性能表現(xiàn),再通過對各類應用的精細化分析,為不同用戶選擇更適合的應用程序。”北京超算(北京超級云計算中心簡稱)技術總監(jiān)甄亞楠對鈦媒體App表示。

北京超算的實踐經(jīng)驗是將解決方案具體細化,只有打通了超算軟件應用生態(tài)的最后一公里,進一步才是向企業(yè)級用戶提供一些定制化的算力服務。“包括算力資源、網(wǎng)絡資源、存儲資源的定制。”甄亞楠說。

不過,有意無意間,在構建一個多元的超算軟件生態(tài)的過程中,“工業(yè)軟件”成為了超算場景下成長最快的應用類型。

超算上長出“工業(yè)軟件”

工業(yè)軟件被卡脖子,這是個被詬病已久的問題。在陸陸續(xù)續(xù)海外工業(yè)軟件停服的案例曝出之后,加大中國工業(yè)軟件的創(chuàng)新速度,就成為了一件非常迫切的事情。而超算與工業(yè)軟件的化學反應,也在這一過程中產(chǎn)生。

論應用,工業(yè)軟件的研發(fā)實踐需要大量的高性能計算來輔助,它與超算能稱得上天然適配。近年來,我國的工業(yè)軟件領域時常面臨“卡脖子”問題,“打好科技儀器設備、操作系統(tǒng)和基礎軟件國產(chǎn)化攻堅戰(zhàn)”也被點名提出,因此,我國超算服務商也在逐漸走上助力國產(chǎn)工業(yè)軟件的道路。

助力國產(chǎn)工業(yè)軟件,首先是幫助其上“云”,建立算力供應鏈,借助超算云服務化模式,在提供大量高性能的算力資源的同時,還能充分發(fā)揮算云融合優(yōu)勢。

但這一過程,具體是怎么有效落地的呢?

鈦媒體App了解到,最重要的是算力供應鏈的建立。通過幫助國產(chǎn)工業(yè)軟件實現(xiàn)上云,能夠使產(chǎn)業(yè)鏈上各企業(yè)、部門進行高效協(xié)作,共同達成智能供應鏈協(xié)同;通過保穩(wěn)算力供應鏈,超算平臺從對接算力用戶到對接國產(chǎn)軟件研發(fā)團隊,充分發(fā)揮橋梁作用。

而提到保穩(wěn)供應鏈,其實就是供應鏈安全性問題。鈦媒體App了解到,北京超算主要是從保障算力供應鏈以及保障軟件供應鏈兩方面入手,來提升算力服務的支撐能力:

在保障算力供應的安全方面,現(xiàn)在北京超算擁有國內最大的通用算力資源池,同時也引入了百PFlops的國產(chǎn)算力資源,可以實現(xiàn)國產(chǎn)算力有效替代,滿足不同用戶的算力需求;

在保障軟件供應鏈方面:北京超算將國產(chǎn)算力資源帶入到國產(chǎn)應用軟件生產(chǎn)和研發(fā)的關鍵環(huán)節(jié),來保障軟件供應鏈安全;目前,其平臺已經(jīng)部署了超過200款的通用計算軟件,還有覆蓋工業(yè)仿真、材料計算、生命科學等細分領域超過30款的國產(chǎn)工業(yè)軟件。

甄亞楠表示,許多軟件在研發(fā)之初都已經(jīng)開始考慮直接基于云上的環(huán)境進行安裝和部署,相對于傳統(tǒng)的比如刻光盤或者刻優(yōu)盤去賣軟件的方式,云端共享軟件的模式更為靈活。“尤其是國產(chǎn)工業(yè)軟件云化,能夠搭載互聯(lián)網(wǎng)優(yōu)勢,使用戶快速、及時地獲取國產(chǎn)工業(yè)軟件的最新功能信息。此外,國產(chǎn)工業(yè)軟件上云也會加速軟件的開發(fā)迭代,通過云化的服務模式開拓出更多的部署環(huán)境。”甄亞楠說到。

不過,幫助工業(yè)軟件云化和保障算力供應鏈安全只是其一,隨著AI時代的加速到來,不只是超算,未來工業(yè)軟件對AI算力或者說智能算力的需求也會逐漸加大,大量的工業(yè)類數(shù)據(jù)需要分析和價值挖掘,超算平臺在塑造多元軟件生態(tài)的過程中,這一趨勢也不得不考慮。

根據(jù)中國信息通信研究院發(fā)布的《中國算力發(fā)展指數(shù)白皮書(2022年)》,2021年全球計算設備算力總規(guī)模達到615EFlops,同比增長44%,其中智能算力規(guī)模為232EFlops,超級算力規(guī)模為14EFlops;2021年中國算力總規(guī)模達到202EFlops,其中智能算力規(guī)模達104EFlops,增速85%,占比超過50%;預計2030年全球算力規(guī)模達到56ZFlops,平均年增速達到65%。

甄亞楠介紹,針對ChatGPT一類的大語言模型,考慮到其強勁的算力需求以及預訓練模型的數(shù)據(jù)處理需要,目前北京超算已經(jīng)具備了百卡、千卡規(guī)模的算力服務能力。此外,北京超算在積極尋求與國內頂尖研究機構的合作,通過集成部署通用框架、自研算法等方式來滿足算力需要。截至目前,北京超算已經(jīng)部署了如A100、V100等在內的多種GPU芯片,以及優(yōu)化部署了一批常用的深度學習框架。

回歸應用,甄亞楠表示,在人工智能場景中,北京超算一方面建設以GPU或加速卡為代表的算力資源,幫助加速科學計算以及人工智能計算結果生成。另一方面,面向推理場景,通過建設大量基于云計算的云主機資源,幫助用戶順利開展在線推理業(yè)務。

基于超算云服務化模式,算力市場還有很大的拓展空間,北京超算助力國產(chǎn)工業(yè)軟件的實踐效果還有待驗證。而AI帶動的萬億藍海,就在那里,依舊波濤洶涌。

版權所有 中華工控網(wǎng) Copyright?2024 Gkong.com, All Rights Reserved