http://m.casecurityhq.com 2024-07-05 11:25 來源:央視新聞
今天(4日)2024世界人工智能大會暨人工智能全球治理高級別會議在上海世博中心啟幕。在“AI賦工業(yè),數(shù)智啟未來”人工智能賦能新型工業(yè)化主題論壇上,《中國AI大模型工業(yè)應(yīng)用指數(shù)(2024年)》發(fā)布。
隨著人工智能技術(shù)的快速迭代發(fā)展,AI大模型工業(yè)應(yīng)用場景不斷豐富。“中國AI大模型工業(yè)應(yīng)用指數(shù)”旨在及時跟蹤國內(nèi)外AI大模型技術(shù)發(fā)展態(tài)勢,挖掘大模型潛在工業(yè)應(yīng)用場景,系統(tǒng)評估通用人工智能與工業(yè)融合的進展與成效。
指數(shù)體系由大模型基礎(chǔ)應(yīng)用能力與行業(yè)應(yīng)用能力構(gòu)成。大模型基礎(chǔ)應(yīng)用能力包含文生文、圖生文等領(lǐng)域的準(zhǔn)確性、穩(wěn)定性能力;大模型的行業(yè)應(yīng)用能力包含民爆、電力、石化、鋼鐵、醫(yī)藥等重點行業(yè)大模型在研發(fā)設(shè)計、生產(chǎn)制造、運維管理等環(huán)節(jié)具體場景的應(yīng)用有效程度。
經(jīng)過多輪測評與專家研討,在基礎(chǔ)應(yīng)用能力方面,率先發(fā)布中國AI大模型文生文準(zhǔn)確性與穩(wěn)定性指數(shù),其中準(zhǔn)確性指數(shù)反映了國內(nèi)外頭部AI大模型在工業(yè)領(lǐng)域文本生成的精準(zhǔn)程度。總體上,國內(nèi)大模型準(zhǔn)確性指數(shù)為78,國際大模型準(zhǔn)確性指數(shù)為76,國內(nèi)頂級大模型在工業(yè)領(lǐng)域文本生成的準(zhǔn)確性已具備競爭力;在行業(yè)知識層面,我國在多個行業(yè)如電力、建材、紡織的知識儲備已經(jīng)具備一定領(lǐng)先優(yōu)勢;細分能力層面,國內(nèi)模型在語句能力和專業(yè)知識掌握上比國外模型更加優(yōu)秀,在數(shù)理能力還有待提升。穩(wěn)定性指數(shù)代表模型在一定外部擾動下持續(xù)給出正確回答的能力,反映模型在復(fù)雜環(huán)境下的魯棒性。總體上,國內(nèi)大模型穩(wěn)定性指數(shù)為71分,低于國際的74分;在行業(yè)知識層面,電力和采礦等行業(yè)知識儲備有待提升;在細分能力層面,國內(nèi)大模型需要在順序變換和邏輯擾動等領(lǐng)域需進一步加強。
在行業(yè)應(yīng)用能力方面,率先發(fā)布中國AI大模型民爆行業(yè)應(yīng)用指數(shù),針對大模型在民爆行業(yè)安全防控場景開展應(yīng)用評測??傮w上,國內(nèi)大模型行業(yè)應(yīng)用指數(shù)為84分,國際為93分,國外大模型仍具備領(lǐng)先優(yōu)勢;在場景細分能力上,國內(nèi)大模型在人員行為監(jiān)測、事故監(jiān)測、危險車輛監(jiān)測細分場景與國外大模型有一定的差距,國內(nèi)模型仍有較大進步空間。