中國(guó)自動(dòng)化學(xué)會(huì)專(zhuān)家咨詢(xún)工作委員會(huì)指定宣傳媒體
新聞詳情
gkongbbs

「深度學(xué)習(xí)+」時(shí)代,百度畫(huà)出了這張 AI 工業(yè)大生產(chǎn)的藍(lán)圖

http://m.casecurityhq.com 2023-01-11 14:21 來(lái)源:雷峰網(wǎng)

  1764年的一天,“珍妮紡紗機(jī)”誕生在英國(guó)一個(gè)織工哈格里夫斯的家中,將織布效率提高了八倍,吹響了人類(lèi)進(jìn)入機(jī)器時(shí)代的號(hào)角。很快,這股“機(jī)器之風(fēng)”就吹到了采煤、冶金、制造、交通等各個(gè)領(lǐng)域。

  一項(xiàng)技術(shù)能夠?qū)⑺挠|角延伸至各行各業(yè),靠的是其底層通用性。正如百度CTO王海峰所說(shuō),深度學(xué)習(xí)具有很強(qiáng)的通用性,呈現(xiàn)出標(biāo)準(zhǔn)化、自動(dòng)化和模塊化的工業(yè)大生產(chǎn)特征。在以人工智能為核心的第四次工業(yè)革命中,也正是深度學(xué)習(xí)技術(shù)的通用性打開(kāi)了AI走向大規(guī)模落地應(yīng)用的空間。其中,深度學(xué)習(xí)框架平臺(tái)和大模型承擔(dān)了技術(shù)基座的角色,被委以AI時(shí)代基礎(chǔ)設(shè)施的重任,前者是讓各類(lèi)神經(jīng)網(wǎng)絡(luò)在不同硬件條件下高效執(zhí)行的樞紐,后者則使用預(yù)訓(xùn)練技術(shù)適配各類(lèi)上游任務(wù)。

  進(jìn)入2023年,深度學(xué)習(xí)下一個(gè)黃金十年的列車(chē)將駛向AI工業(yè)大生產(chǎn)時(shí)代,我們要如何穿過(guò)迷霧、找到AI技術(shù)創(chuàng)新和產(chǎn)業(yè)落地的最佳路徑?在深度學(xué)習(xí)領(lǐng)域有著十余年技術(shù)積淀的百度,及時(shí)地給出了一個(gè)答案:“深度學(xué)習(xí)+”。

  在今天的百度Create AI開(kāi)發(fā)者大會(huì)上,百度CTO王海峰發(fā)表了題為《“深度學(xué)習(xí)+”,創(chuàng)新發(fā)展新引擎》的主題演講,他提出:人工智能的技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展,已經(jīng)進(jìn)入“深度學(xué)習(xí)+”階段。

王海峰在百度Create AI開(kāi)發(fā)者大會(huì)上

  王海峰揭示了“深度學(xué)習(xí)+”的“+”在三個(gè)層面的內(nèi)涵:

  技術(shù)角度,是深度學(xué)習(xí)+知識(shí);

  生態(tài)角度,是深度學(xué)習(xí)+上下游生態(tài)伙伴;

  產(chǎn)業(yè)角度,是深度學(xué)習(xí)+千行百業(yè)。

  AI走向規(guī)模化的大生產(chǎn),這三個(gè)層面缺一不可。

  01知識(shí):AI是通才,也是行業(yè)專(zhuān)才

  過(guò)去幾年,深度學(xué)習(xí)模型在視覺(jué)、NLP、語(yǔ)音等各領(lǐng)域已經(jīng)取得了巨大成功,但業(yè)內(nèi)的一個(gè)普遍共識(shí)是,目前模型還存在可解釋性差、通用性不強(qiáng)的弊病,模型的性能也還有很大的提升空間。

  一個(gè)關(guān)鍵原因就在于,模型在學(xué)習(xí)過(guò)程中缺乏先驗(yàn)知識(shí)的輸入。這從技術(shù)上筑起了一道墻,攔住了AI走向大規(guī)模產(chǎn)業(yè)化的路。

  在王海峰看來(lái),深度學(xué)習(xí)+知識(shí),是AI技術(shù)進(jìn)一步發(fā)展的重要方向。

  人類(lèi)的推理能力依賴(lài)知識(shí),知識(shí)凝結(jié)了人類(lèi)千百年來(lái)的智慧,捕獲和識(shí)別領(lǐng)域知識(shí)并將其編碼到模型當(dāng)中,提升模型對(duì)于知識(shí)的記憶和推理能力,這種知識(shí)增強(qiáng)的深度學(xué)習(xí)范式更為接近人類(lèi)大腦。

  在AI的大模型時(shí)代,為智能注入更多智慧,這正是百度走出的一條與眾不同的大模型路線。

  2018年,谷歌發(fā)布語(yǔ)言模型BERT,在NLP領(lǐng)域掀起了預(yù)訓(xùn)練模型的技術(shù)革命。百度則是國(guó)內(nèi)最早一批占領(lǐng)高地的機(jī)構(gòu),2019年3月,百度發(fā)布并開(kāi)源了國(guó)內(nèi)首個(gè)知識(shí)增強(qiáng)的語(yǔ)言模型文心ERNIE 1.0,它在語(yǔ)言推理、問(wèn)答匹配等各類(lèi)中文語(yǔ)言任務(wù)上的性能超過(guò)了BERT。通過(guò)引入知識(shí)圖譜,將海量數(shù)據(jù)與多源的豐富知識(shí)相融合,模型的學(xué)習(xí)效率大大提高,可解釋性也得到了增強(qiáng)。

  這先行的一步,背后是百度在NLP領(lǐng)域深厚的技術(shù)積累,早在2010年,國(guó)際頂級(jí)NLP專(zhuān)家王海峰加盟百度后,就牽頭成立了國(guó)內(nèi)第一個(gè)NLP研發(fā)部門(mén),如今也在大模型上發(fā)力最早。

  到了今天,文心系列大模型的參數(shù)規(guī)模最高已經(jīng)進(jìn)化到千億級(jí)別,在語(yǔ)言理解、文本生成、跨模態(tài)語(yǔ)義理解等領(lǐng)域取得了多項(xiàng)技術(shù)突破。百度沿著“深度學(xué)習(xí)+知識(shí)”這條路線,走出了大模型的差異化道路,并且已經(jīng)走得很穩(wěn)、很長(zhǎng)遠(yuǎn)。

百度文心大模型發(fā)展歷程

  縱觀國(guó)內(nèi)各家大模型的發(fā)展,與其他玩家相比,百度更早地從拼參數(shù)的盲目風(fēng)潮中抽身,確立了文心的另一個(gè)“殺手锏”:產(chǎn)業(yè)級(jí)。

  這背后遵循的依然是“深度學(xué)習(xí)+知識(shí)”的邏輯:在AI走向大規(guī)模產(chǎn)業(yè)化的過(guò)程中,大模型在具備通用知識(shí)的同時(shí),必然還要向各行各業(yè)“拜師學(xué)習(xí)”,進(jìn)而成為精通各領(lǐng)域的“專(zhuān)家”。

  所以,“+知識(shí)”加的不僅是科學(xué)知識(shí)、經(jīng)驗(yàn)知識(shí),還要有行業(yè)知識(shí)。

  為了填補(bǔ)基礎(chǔ)模型與應(yīng)用場(chǎng)景之間的鴻溝,在文心通用大模型的基礎(chǔ)上,百度與多個(gè)領(lǐng)域的頭部企業(yè)和機(jī)構(gòu)合作,運(yùn)用行業(yè)知識(shí)增強(qiáng)技術(shù),首次把各個(gè)行業(yè)的特有數(shù)據(jù)和知識(shí)融合到大模型中,將大模型的能力適配和延展到了能源電力、金融、航天、傳媒、影視、汽車(chē)、城市管理、燃?xì)?、保險(xiǎn)、電子制造和社科等多個(gè)領(lǐng)域。

  百度的11個(gè)行業(yè)大模型,勾勒出了未來(lái)AI工業(yè)大生產(chǎn)圖景的雛形。

百度文心行業(yè)大模型

  目前來(lái)看,大模型的產(chǎn)業(yè)化尚任重道遠(yuǎn),而2022年AIGC賽道的火爆,則給我們指明了眼下大模型落地最為清晰的一個(gè)路徑。

  OpenAI于去年4月發(fā)布的文生圖模型DALL·E 2打響了AI繪畫(huà)熱潮的第一槍?zhuān)S后Stability AI在8月推出開(kāi)源的Stable Diffusion模型,讓AI繪畫(huà)的圈子徹底沸騰起來(lái)。

  而在Stable Diffusion上線前三天的8月19日,百度就發(fā)布了一款A(yù)I繪畫(huà)產(chǎn)品——文心一格。它基于文心大模型的技術(shù),能夠根據(jù)文字生成多種風(fēng)格的高清畫(huà)作,是普通人進(jìn)行高質(zhì)量藝術(shù)創(chuàng)作的一支“神筆”。而長(zhǎng)遠(yuǎn)來(lái)看,AI作畫(huà)在toB端有著更為寬廣的場(chǎng)景,在解決了版權(quán)、生成的可控性等難題后,像文心一格這樣的工具在移動(dòng)內(nèi)容生產(chǎn)、游戲、工業(yè)設(shè)計(jì)等場(chǎng)景都會(huì)有廣泛的應(yīng)用。

文心一格官網(wǎng)

  AIGC巨大的想象空間植根于大模型的跨模態(tài)能力。多模態(tài)學(xué)習(xí)是深度學(xué)習(xí)在下一個(gè)十年的重點(diǎn)方向,如同人類(lèi)能從一段文字描述中構(gòu)想出一幅畫(huà)面,模型融合了語(yǔ)言、視覺(jué)等多模態(tài)知識(shí)后,可具備跨模態(tài)生成的能力,文生圖、文生視頻都會(huì)是未來(lái)大模型的風(fēng)口所在。

  這也便是“深度學(xué)習(xí)+知識(shí)”這一概念在模態(tài)層面的延展。

  02生態(tài):乘飛槳駛向產(chǎn)業(yè)更深處

  一項(xiàng)缺乏生態(tài)體系的技術(shù),終究會(huì)被歷史淘汰。

  AI技術(shù)要走向工業(yè)大生產(chǎn),深度學(xué)習(xí)框架、基礎(chǔ)算法、AI芯片以及數(shù)據(jù)、應(yīng)用和人才等等,都缺一不可。在AI的產(chǎn)業(yè)鏈上,每一個(gè)需求和反饋都需要順暢地傳遞到深度學(xué)習(xí)技術(shù)及應(yīng)用的每個(gè)環(huán)節(jié),經(jīng)過(guò)各環(huán)節(jié)的持續(xù)迭代優(yōu)化,才能最終加速AI的技術(shù)創(chuàng)新和產(chǎn)業(yè)化。

  正是基于這樣的思考,百度提出了“深度學(xué)習(xí)+上下游生態(tài)伙伴”的觀點(diǎn)。

  在這樣一個(gè)生態(tài)體系中,深度學(xué)習(xí)框架上承神經(jīng)網(wǎng)絡(luò)模型和應(yīng)用,下接各類(lèi)芯片,因而處于一個(gè)非常核心的位置。類(lèi)比PC時(shí)代的操作系統(tǒng)Windows、移動(dòng)時(shí)代的操作系統(tǒng)IOS和安卓,王海峰認(rèn)為,深度學(xué)習(xí)框架可以說(shuō)是當(dāng)今“智能時(shí)代的操作系統(tǒng)”。

  一個(gè)好的框架,能夠幫助開(kāi)發(fā)者和企業(yè)大幅提升深度學(xué)習(xí)模型的研發(fā)效率及效果,避免重復(fù)“造輪子”。尤其是對(duì)于大模型而言,框架可以解決開(kāi)發(fā)效率低、推理速度慢、部署成本不可控、芯片難以適配等棘手難題。

  百度的飛槳平臺(tái)(PaddlePaddle)作為一個(gè)技術(shù)底座,其強(qiáng)大的能力如今已經(jīng)在文心系列大模型上得到了驗(yàn)證。而回溯飛槳的誕生,從一開(kāi)始,它就不僅僅是百度自身的一個(gè)成果,更是中國(guó)AI發(fā)展歷史上的一次重大飛躍。早在2012年,百度就開(kāi)始探索深度學(xué)習(xí)技術(shù)及應(yīng)用。2013年1月,百度建立全世界第一個(gè)深度學(xué)習(xí)研究院(IDL),并開(kāi)始布局研發(fā)深度學(xué)習(xí)框架,最終于2016年開(kāi)源首個(gè)國(guó)產(chǎn)深度學(xué)習(xí)框架PaddlePaddle。在國(guó)內(nèi)市場(chǎng)上,PaddlePaddle至今都是唯一可與國(guó)際兩大主流框架TensorFlow和PyTorch正面交鋒的深度學(xué)習(xí)框架。

  而細(xì)究中國(guó)人在深度學(xué)習(xí)框架領(lǐng)域的研究歷史,我們會(huì)發(fā)現(xiàn)這樣一個(gè)演變:早期的代表性框架如Caffe(2014年)和MXnet(2015年)都始于學(xué)術(shù)界,出自一群在國(guó)外讀博的華人學(xué)生之手,而從PaddlePaddle開(kāi)始,百度向深度學(xué)習(xí)框架注入了深厚的產(chǎn)業(yè)基因。直到2020年,各家公司紛紛推出自己的框架,國(guó)產(chǎn)框架才迎來(lái)在產(chǎn)業(yè)界的爆發(fā)元年。

  2019年,PaddlePaddle擁有了中文名“飛槳”,其直意是“很快的快船”。如今,乘著這艘快船,AI已經(jīng)駛向了技術(shù)落地的深水區(qū)。飛槳平臺(tái)已經(jīng)匯聚了535萬(wàn)開(kāi)發(fā)者、創(chuàng)建了67萬(wàn)個(gè)AI模型,服務(wù)著20萬(wàn)家企事業(yè)單位。

百度飛槳全景圖

  可以看到的是,越來(lái)越多的企業(yè)正在借助飛槳的AI技術(shù)生態(tài),進(jìn)行低門(mén)檻的AI應(yīng)用和開(kāi)發(fā)。例如,中小型企業(yè)可以基于飛槳開(kāi)發(fā)大量不同種類(lèi)的技術(shù)服務(wù)型應(yīng)用或者模型,大企業(yè)則可以憑借自身的數(shù)據(jù)優(yōu)勢(shì),借助飛槳提升業(yè)務(wù)經(jīng)營(yíng)效率?;谘邪l(fā)模型所用的核心框架、包含各種已經(jīng)訓(xùn)練好的深度學(xué)習(xí)模型的模型庫(kù)、支持低代碼的開(kāi)發(fā)套件和工具組件,以及飛槳企業(yè)版零門(mén)檻AI開(kāi)發(fā)平臺(tái)EasyDL和全功能AI開(kāi)發(fā)平臺(tái)BML,飛槳將AI的能力開(kāi)放給了各行各業(yè)。

  事實(shí)上,從生態(tài)的角度看,百度不僅是國(guó)內(nèi)唯一,而且是全球范圍內(nèi)極少數(shù)擁有全棧布局的人工智能公司。

  在AI的算力層,飛槳亦建設(shè)了極具競(jìng)爭(zhēng)力的硬件生態(tài)。飛槳正緊密與國(guó)內(nèi)外硬件廠商開(kāi)展軟硬一體聯(lián)合優(yōu)化,截止目前已有超過(guò)30家硬件廠商與飛槳深度融合優(yōu)化,國(guó)內(nèi)外主流芯片基本都已適配飛槳。2022年,飛槳還聯(lián)合硬件伙伴發(fā)布了“硬件生態(tài)共創(chuàng)計(jì)劃”,目前伙伴數(shù)量已達(dá)28家,包括英特爾、英偉達(dá)等硬件廠商。

  從中國(guó)第一款云端全功能AI芯片“昆侖”、飛槳深度學(xué)習(xí)框架、文心大模型等核心技術(shù),到搜索、智能云、自動(dòng)駕駛、智能家居等應(yīng)用,百度自身的技術(shù)創(chuàng)新與落地體系,是國(guó)內(nèi)AI走向工業(yè)大生產(chǎn)的一個(gè)縮影。

  03千行百業(yè):百度的大視野

  AI技術(shù)最終要落到何處?在百度看來(lái),必然是千行百業(yè)。

  憑借飛槳平臺(tái)和文心大模型,百度不僅在自身的搜索、信息流等業(yè)務(wù)中實(shí)現(xiàn)了大規(guī)模應(yīng)用,還將眼光放在了更廣闊的各行各業(yè)上:工業(yè)、農(nóng)業(yè)、能源、城市、科學(xué)計(jì)算等等20多個(gè)領(lǐng)域。

  應(yīng)用深度學(xué)習(xí)技術(shù)來(lái)降本增效,基本上已經(jīng)成為各行各業(yè)的一個(gè)共識(shí),但企業(yè)要真正應(yīng)用AI來(lái)解決實(shí)際問(wèn)題,面臨的難題其實(shí)不少:

  首先,每個(gè)行業(yè)有每個(gè)行業(yè)的難題,行業(yè)雖數(shù)得過(guò)來(lái),但細(xì)分場(chǎng)景的數(shù)量是難以統(tǒng)計(jì)的,提供算法、模型的AI公司很難洞悉每個(gè)行業(yè)自身的特殊場(chǎng)景需求。其次,傳統(tǒng)行業(yè)大都沒(méi)有自己的AI研發(fā)團(tuán)隊(duì),算法生產(chǎn)的成本相對(duì)太高,不是所有企業(yè)都能承擔(dān)得起的。此外,沒(méi)有適用工業(yè)場(chǎng)景的部署硬件系統(tǒng),也成了AI落地的“最后一公里”難題。

  為此,百度飛槳給出的解法是,基于行業(yè)的特色數(shù)據(jù),為企業(yè)提供相當(dāng)于“一整個(gè)算法團(tuán)隊(duì)”的能力。

  舉一個(gè)制造業(yè)的例子。在每架飛機(jī)起飛前和降落后,飛機(jī)航線維修人員都需要進(jìn)行全面的檢修,但人工檢修很難做到100%不出差錯(cuò)。因此,許多飛機(jī)維修服務(wù)公司希望能開(kāi)發(fā)一款輔助檢修的AI應(yīng)用,但沒(méi)有專(zhuān)業(yè)的算法團(tuán)隊(duì),預(yù)算也不夠,這件事無(wú)從下手。在四川賽福威飛機(jī)維修服務(wù)有限公司,一位IT項(xiàng)目負(fù)責(zé)人最終借助百度飛槳EasyDL平臺(tái)解決了這個(gè)難題。毫無(wú)AI算法經(jīng)驗(yàn)的他,基于EasyDL平臺(tái)開(kāi)發(fā)了一套機(jī)務(wù)維修安全衛(wèi)士系統(tǒng),能夠高效檢測(cè)飛機(jī)空速管套、飛行記錄本等,已經(jīng)在長(zhǎng)沙黃花機(jī)場(chǎng)實(shí)現(xiàn)了落地。

  機(jī)務(wù)維修安全衛(wèi)士系統(tǒng)對(duì)飛機(jī)空速管和管套檢測(cè)

  飛槳還正在讓AI走進(jìn)田間地頭。在北京市大興區(qū)長(zhǎng)子營(yíng)鎮(zhèn),百度飛槳與京東方后稷、裕農(nóng)聯(lián)合打造了一個(gè)AI智慧植物工廠?;诎俣華I技術(shù)算法構(gòu)建的克重識(shí)別模型,通過(guò)拍攝的圖片就識(shí)別重量、健康狀態(tài),準(zhǔn)確率達(dá)到95%以上;基于飛槳EasyDL平臺(tái)的目標(biāo)檢測(cè)模型則實(shí)現(xiàn)了自動(dòng)識(shí)別常見(jiàn)昆蟲(chóng),識(shí)別精度達(dá)到90%。

目標(biāo)檢測(cè)模型進(jìn)行蟲(chóng)害預(yù)警

  從前,為了觀察蔬菜的生長(zhǎng)和蟲(chóng)害情況,廠里唯一一位農(nóng)業(yè)專(zhuān)家需日行兩三萬(wàn)步,而現(xiàn)在,在2600平米的空間里,AI 正在24小時(shí)看護(hù)植物,兩位工人只需做一些基礎(chǔ)工作,整體工作效率大大提高。像這樣的智慧植物工廠,正在落地到全國(guó)各地的智能溫室中。

  國(guó)內(nèi)有著龐大而豐富的產(chǎn)業(yè)體系,這為AI技術(shù)落地帶來(lái)了巨大機(jī)遇,百度飛槳正在讓強(qiáng)大的AI變得人人可用,為每一個(gè)行業(yè)的問(wèn)題提供答案。同時(shí),豐富的應(yīng)用場(chǎng)景也反過(guò)來(lái)會(huì)推動(dòng)底層技術(shù)本身的突破,形成一個(gè)良性循環(huán)。

  04寫(xiě)在最后

  大衛(wèi)·米切爾在他的科幻小說(shuō)《云圖》中說(shuō):歷史是一副牌,從中隨意抽出幾張出來(lái),我們的祖輩那代抽到的是3、4、5,而我們這一代人抽到的則是10、J和Q。

  一代人有一代人的使命。深度學(xué)習(xí)的前十年,AI的能力在算法、學(xué)術(shù)論文、紙上項(xiàng)目中不斷打破天花板、刷新人類(lèi)的認(rèn)知;而在下一個(gè)十年,AI的工業(yè)大生產(chǎn)是落在我們肩頭的使命。在這個(gè)過(guò)程中,國(guó)內(nèi)一眾大廠必然要擔(dān)當(dāng)起引領(lǐng)者的角色。于百度而言,它不曾錯(cuò)失過(guò)去十年深度學(xué)習(xí)的每一個(gè)重要節(jié)點(diǎn),今日,百度在業(yè)界率先提出“深度學(xué)習(xí)+”的概念,則又是一次先行者的遠(yuǎn)見(jiàn)。

  在國(guó)際人工智能競(jìng)爭(zhēng)愈發(fā)激烈的當(dāng)下,中國(guó)AI的下一個(gè)十年要往何處走,百度已經(jīng)趟出了一條清晰可見(jiàn)的路。以大模型為例,谷歌、微軟、Meta、OpenAI、英偉達(dá)等國(guó)外科技巨頭都在這條賽道上競(jìng)相追逐,對(duì)比之下,在資源投入、技術(shù)創(chuàng)新、商業(yè)化落地等方面,國(guó)內(nèi)的大模型發(fā)展都不容樂(lè)觀,近日火爆出圈的ChatGPT更是引許多國(guó)內(nèi)研究者發(fā)出了“此誠(chéng)危急存亡之秋”的呼喊。

  在AI深入產(chǎn)業(yè)的視野下,國(guó)產(chǎn)大模型配國(guó)產(chǎn)架構(gòu),這是百度區(qū)別于其他AI玩家的核心競(jìng)爭(zhēng)優(yōu)勢(shì)。在2023年的開(kāi)始,百度用“深度學(xué)習(xí)+”初步打造了一個(gè)AI工業(yè)大生產(chǎn)的宇宙,期待更多住民的到來(lái)。

版權(quán)所有 中華工控網(wǎng) Copyright?2024 Gkong.com, All Rights Reserved