http://m.casecurityhq.com 2024-03-26 10:22 來源:英偉達(dá)
北京時(shí)間3月19日凌晨,英偉達(dá)(NVIDIA)公司創(chuàng)始人兼首席執(zhí)行官黃仁勛在 GTC2024 發(fā)表主題演講,發(fā)布了加速計(jì)算以及機(jī)器人領(lǐng)域的最新突破性成果,其中最大的爆點(diǎn)無疑是全新 Blackwell 架構(gòu)的推出。
基于 Blackwell 架構(gòu),英偉達(dá)還正式發(fā)布了全球最強(qiáng)的B200 和 GB200 超級(jí)芯片,以及由36組 Grace CPU 和72組 Blackwell GPU 組合而成的液冷機(jī)架級(jí)系統(tǒng) GB200 NVL72 。
據(jù)英偉達(dá)介紹
Nvidia NVL72 機(jī)架級(jí) AI 系統(tǒng)擁有1440petaflops(又名1.4exaflops)的推理能力,能夠支持大規(guī)模的訓(xùn)練和推理任務(wù),可處理高達(dá)27萬億個(gè)參數(shù)的大語言模型。與用于推理用途的相同數(shù)量的 H100 Tensor Core 圖形處理單元相比,GB200 NVL72性能提升高達(dá)30倍。此外,該系統(tǒng)還可將成本和能耗降低多達(dá)25倍。
GB200 NVL72 液冷機(jī)架服務(wù)器
想要發(fā)揮最大性能并非易事,需要考慮眾多因素,為充分發(fā)揮 Blackwell 架構(gòu)的潛力,英偉達(dá)的GB200 NVL72 機(jī)架級(jí)服務(wù)器采用液態(tài)冷卻系統(tǒng)。事實(shí)上,對(duì)于 Blackwell 架構(gòu)的芯片來說,采用液態(tài)冷卻系統(tǒng)不僅是最佳選擇,而且?guī)缀跏沁\(yùn)行的必備條件。
粗略估算,在全負(fù)荷運(yùn)轉(zhuǎn)下,GB200 包括兩個(gè)1200W的GPU,以及300W的Arm CPU,可能的總功耗大約為2700W,遠(yuǎn)超傳統(tǒng)風(fēng)冷能力所及。然而借助液冷系統(tǒng)配置,即便在滿負(fù)荷運(yùn)作時(shí),芯片的熱輸出也可以達(dá)到1200W,同時(shí)實(shí)現(xiàn)20petaflops 的強(qiáng)大性能。通過采用液冷技術(shù),英偉達(dá)得以繼續(xù)突破AI加速器的性能極限,而無需擔(dān)憂冷卻系統(tǒng)的限制,據(jù)悉,英偉達(dá)計(jì)劃在后續(xù)全系列產(chǎn)品上應(yīng)用液冷散熱技術(shù)。
服務(wù)器液冷技術(shù)
如今,在人工智能訓(xùn)練負(fù)載任務(wù)日益復(fù)雜、相應(yīng)硬件功耗不斷上升的背景下,液冷技術(shù)已經(jīng)成為解決人工智能服務(wù)器高功耗散熱的核心方案,可以使核心芯片發(fā)揮出最佳性能水平。
史陶比爾作為全球快速連接解決方案的佼佼者,在液冷技術(shù)領(lǐng)域具備超過30年的深入研究和批量部署經(jīng)驗(yàn),專注于為服務(wù)器液冷系統(tǒng)提供安全、可靠,且優(yōu)于行業(yè)標(biāo)準(zhǔn)的液冷連接器解決方案。在AIGC等先進(jìn)人工智能模型需求不斷攀升的驅(qū)動(dòng)下,憑借技術(shù)實(shí)力和產(chǎn)品可靠性,史陶比爾能夠?yàn)橐豪湎到y(tǒng)在服務(wù)器領(lǐng)域的加速發(fā)展提供強(qiáng)力的技術(shù)支持和保障,為構(gòu)建能效更高的AI服務(wù)器系統(tǒng)貢獻(xiàn)力量。