中國自動化學會專家咨詢工作委員會指定宣傳媒體
新聞詳情
gkongbbs

福布斯2024年人工智能發(fā)展的十大預見

http://m.casecurityhq.com 2024-01-29 11:38 來源:福布斯中國

近日,福布斯公布了他們對2024年人工智能發(fā)展的十大預見,這些預測簡潔而又充滿洞察力。

01

Nvidia將努力成為云提供商

大多數(shù)企業(yè)并不直接向Nvidia購買GPU。相反,它們通過亞馬遜網(wǎng)絡服務(Amazon Web Services)、微軟Azure和谷歌云平臺(Google Cloud Platform)等云服務提供商獲得GPU,而這些云服務提供商又從Nvidia 大量購買芯片。

但亞馬遜、微軟和谷歌——Nvidia的最大客戶,正迅速成為其競爭對手。由于認識到人工智能的價值主要來自硅層(Nvidia的股價就是最好的證明),主要的云提供商都在投入巨資開發(fā)自己的本土人工智能芯片,這將與Nvidia的GPU直接競爭。

隨著云計算提供商希望將技術堆棧下移到硅層以獲取更多價值,看到Nvidia朝相反的方向發(fā)展也不要感到驚訝:提供自己的云服務并運營自己的數(shù)據(jù)中心,以減少傳統(tǒng)上對云計算公司的分銷依賴。

Nvidia已經(jīng)開始探索這條道路,今年早些時候推出了名為DGX Cloud的新云服務。我們預測,Nvidia將在明年切實加強這一戰(zhàn)略。

這可能需要Nvidia建立自己的數(shù)據(jù)中心(DGX Cloud目前位于其他云提供商的物理基礎設施內(nèi));甚至可能需要Nvidia收購像CoreWeave這樣的新興云提供商(Nvidia已經(jīng)與CoreWeave建立了密切的合作伙伴關系),作為垂直整合的一種方式。無論如何,預計進入2024年后,Nvidia與大型云計算提供商之間的關系將變得更加復雜。

02

Stability AI將會倒閉

這是人工智能界最不為人知的秘密之一:曾經(jīng)如日中天的初創(chuàng)公司Stability AI在2023年的大部分時間里都在緩慢地發(fā)展。

Stability正在大出血。最近幾個月離職的包括公司的首席運營官、首席人事官、工程副總裁、產(chǎn)品副總裁、應用機器學習副總裁、通信副總裁、研究主管、音頻主管和法律總顧問。

據(jù)報道,由于與Stability首席執(zhí)行官埃馬德·莫斯塔克(Emad Mostaque)發(fā)生爭執(zhí),去年領導Stability高調(diào)完成1億美元融資的兩家公司Coatue和Lightspeed近幾個月都退出了公司董事會。今年早些時候,該公司曾試圖以40億美元的估值籌集更多資金,但以失敗告終。

明年,我們預測這家陷入困境的公司將在越來越大的壓力下屈服,徹底關閉。

據(jù)報道,迫于投資者的壓力,Stability公司已開始尋找收購方,但迄今為止仍興趣缺缺。

Stability的一個有利條件是:公司最近從英特爾公司融資5000萬美元,這筆現(xiàn)金注入將延長公司的運營時間。就英特爾而言,這筆投資似乎反映出其迫切希望獲得高知名度客戶對其新型人工智能芯片的支持,以在與競爭對手英偉達(Nvidia)的競爭中占據(jù)優(yōu)勢。

但Stability的燒錢速度之快是出了名的:據(jù)報道,在10月份英特爾投資Stability時,Stability的月支出為800萬美元,而帶來的收入僅為這個數(shù)字的一小部分。按照這個速度,5000萬美元的投資撐不到2024年底。

03

“大型語言模型”和“LLM”這兩個術語將不再常見

在當今的人工智能領域,“大型語言模型”(及其縮寫LLM)經(jīng)常被用作 “任何高級人工智能模型”的簡稱。這是可以理解的,因為許多最初崛起的生成式人工智能模型(如GPT-3)都是純文本模型。

但是,隨著人工智能模型類型的增多,以及人工智能變得越來越多模態(tài)化,這個術語將變得越來越不精確和無用。多模態(tài)人工智能的出現(xiàn)是2023年人工智能的決定性主題之一。當今許多領先的生成式人工智能模型都結(jié)合了文本、圖像、三維、音頻、視頻、音樂、肢體動作等等。它們遠不止是語言模型。

請看一個人工智能模型,它根據(jù)已知蛋白質(zhì)的氨基酸序列和分子結(jié)構(gòu)進行訓練,以生成全新的蛋白質(zhì)療法。雖然其底層架構(gòu)是GPT-3等模型的延伸,但將其稱為大型語言模型真的有意義嗎?

或者考慮一下機器人學中的基礎模型:大型生成模型將視覺和語言輸入與一般互聯(lián)網(wǎng)知識相結(jié)合,以便在現(xiàn)實世界中采取行動,例如通過機械臂。對于這類模型,應該而且將會有一個比“語言模型”更豐富的術語。(“視覺-語言-行動”模型或VLA模型是研究人員使用的另一種說法)。

DeepMind最近發(fā)布的FunSearch模型也有類似的意思,作者自己稱其為 LLM,但它涉及的是數(shù)學而非自然語言。

2024年,隨著我們的模型變得越來越多維,我們用來描述它們的術語也將越來越多維。

04

最先進的封閉模型將繼續(xù)大幅超越最先進的開放模型

當今人工智能討論的一個重要話題是圍繞開源和閉源人工智能模型的爭論。雖然大多數(shù)頂尖人工智能模型開發(fā)商——OpenAI、谷歌DeepMind、Anthropic、Cohere等公司都將其最先進的模型作為專利,但包括Meta和熱門新創(chuàng)公司Mistral在內(nèi)的少數(shù)幾家公司卻選擇公開其最先進的模型權重。

如今,性能最高的基礎模型(如OpenAI的GPT-4)都是閉源的。但許多開源倡導者認為,封閉模型與開放模型之間的性能差距正在縮小,而且開放模型有望在性能上超越封閉模型,或許到明年就能實現(xiàn)。(這張圖最近在網(wǎng)上瘋傳)。

我們不同意這一觀點。我們預測,最好的封閉式模型在2024年(及以后)將繼續(xù)明顯優(yōu)于最好的開放式模型。

基礎模型的性能是一個快速發(fā)展的前沿領域。Mistral最近夸口說,它將在2024年的某個時候開源GPT-4級模型,這一說法在開源社區(qū)引起了轟動。但OpenAI在2023年初就發(fā)布了GPT-4。等到Mistral推出這個新模型時,很可能已經(jīng)落后一年多了。屆時,OpenAI很可能已經(jīng)發(fā)布了GPT-4.5,甚至GPT-5,從而開創(chuàng)一個全新的性能領域。(有傳言稱,GPT-4.5甚至可能在2023年底前發(fā)布)。

與許多其他領域一樣,在另一個團體確定了前沿之后,作為快速追隨者趕上前沿,要比在其他人證明這是可能的之前建立一個新的前沿更容易實現(xiàn)。例如,OpenAI使用專家混合架構(gòu)構(gòu)建GPT-4的風險、挑戰(zhàn)和成本都要比Mistral在幾個月后用自己的專家混合模型追隨OpenAI的腳步要高得多,因為在此之前,這種方法還沒有被證明能在這種規(guī)模下工作。

有一個基本的結(jié)構(gòu)性原因讓人懷疑,開放模型的性能是否會在2024年超越封閉模型。開發(fā)一個能推動技術發(fā)展的新模型所需的投資是巨大的,而且隨著模型能力的每一步提升,投資只會繼續(xù)膨脹。一些行業(yè)觀察家估計,OpenAI將花費約20億美元來開發(fā)GPT-5。

Meta是一家上市公司,最終要對股東負責。該公司似乎并不指望從其發(fā)布的開源模型中獲得任何直接收入。據(jù)報道,Llama2的制造成本約為2000萬美元;考慮到戰(zhàn)略利益,即使沒有任何相關的收入增長,這樣的投資水平也是合理的。但是,Meta公司真的打算投入近20億美元來打造一個性能超越其他任何公司的人工智能模型,而僅僅是為了開源而不期望獲得任何具體的投資回報嗎?

像Mistral這樣的后起之秀也面臨著類似的難題。開源基礎模型并沒有明確的收入模式(Stability AI公司就有過這樣的慘痛教訓)。例如,對托管開源模型收費,就成了一場價格競爭,正如我們最近在Mistral的新Mixtral模型中看到的那樣。那么,即使Mistral能夠獲得所需的數(shù)十億美元來構(gòu)建一種新模式,從而超越OpenAI——它真的會選擇轉(zhuǎn)過身來免費開源這種模式嗎?

我們隱隱懷疑,隨著Mistral這樣的公司投入越來越多的資金來構(gòu)建更強大的人工智能模型,他們最終可能會放松對開源的態(tài)度,將最先進的模型保留為專有,以便收費。

要明確的是:這并不是在反對開源人工智能的優(yōu)點。這并不是說開源人工智能在未來的人工智能世界中將不再重要。恰恰相反,我們預計開源模型將在未來幾年人工智能的普及中發(fā)揮關鍵作用。但是:我們預測,最先進的人工智能系統(tǒng),那些能夠推動人工智能發(fā)展的前沿系統(tǒng),將繼續(xù)是專有的。

05

多家財富500強企業(yè)將設立一個新的高管職位:首席人工智能官

人工智能已成為今年財富500強企業(yè)的首要任務,各行各業(yè)的董事會和管理團隊都在爭先恐后地研究這項強大的新技術對企業(yè)意味著什么。

我們預計,明年大型企業(yè)將更普遍地采取一種策略:任命一位“首席人工智能官”來領導企業(yè)的人工智能計劃。

在十年前云計算興起的時候,我們也看到了類似的趨勢,許多企業(yè)都聘請了“首席云計算官”來幫助他們應對云計算的戰(zhàn)略影響。

這一趨勢將在企業(yè)界獲得更多動力,因為政府部門已經(jīng)出現(xiàn)了并行趨勢。拜登總統(tǒng)最近發(fā)布的人工智能行政命令要求每個聯(lián)邦政府機構(gòu)任命一名首席人工智能官,這意味著未來幾個月美國政府將新聘400多名首席人工智能官。

任命首席人工智能官將成為公司對外表明其對人工智能態(tài)度的一種流行方式。至于這些職位能否長期發(fā)揮價值,則是另一個問題。(如今還有多少首席云計算官?)

06

transformer架構(gòu)的替代方案將得到有意義的采用

transformer架構(gòu)是谷歌在2017年發(fā)表的一篇開創(chuàng)性論文中提出的,是當今人工智能技術的主流范式?,F(xiàn)存的每個主要生成式人工智能模型和產(chǎn)品-ChatGPT、Midjourney、GitHub Copilot等等,都是使用transformer構(gòu)建的。

但是,沒有哪種技術能永遠占據(jù)主導地位。

在人工智能研究界的邊緣,有幾個團體一直在努力開發(fā)新型的下一代人工智能架構(gòu),這些架構(gòu)在不同方面都優(yōu)于transformer。

克里斯·雷(Chris Ré)在斯坦福大學的實驗室就是這些努力的一個關鍵樞紐。雷和他的學生們的工作中心的主題是建立一種新的模型架構(gòu),這種架構(gòu)可隨序列長度以次二次方的方式擴展(而不是像transformer那樣以四次方的方式擴展)。次二次方擴展將使人工智能模型:(1)計算密集度更低;(2)與變換器相比,能更好地處理長序列。近年來,Ré實驗室推出的著名亞二次方模型架構(gòu)包括S4、Monarch Mixer和Hyena。

最新的次二次元架構(gòu),或許也是最有前途的架構(gòu)——是Mamba。Mamba由雷的兩位門生于上個月發(fā)表,在人工智能研究界引起了巨大反響,一些評論家將其譽為“transformer的終結(jié)者”。

其他試圖構(gòu)建transformer架構(gòu)替代方案的努力還包括麻省理工學院開發(fā)的液態(tài)神經(jīng)網(wǎng)絡,以及由transformer聯(lián)合發(fā)明人之一領導的新創(chuàng)公司Sakana AI。

明年,我們預測這些挑戰(zhàn)者架構(gòu)中的一個或多個將取得突破并贏得真正的采用,從單純的研究新穎性過渡到用于生產(chǎn)的可靠替代人工智能方法。

需要明確的是,我們預計transformer不會在2024年消失。它們是一種根深蒂固的技術,世界上最重要的人工智能系統(tǒng)都是基于這種技術。但我們預測,在2024年,transformer的尖端替代品將成為現(xiàn)實世界人工智能用例的可行選擇。

07

云服務提供商對人工智能初創(chuàng)公司的戰(zhàn)略投資,以及相關的會計影響,將受到監(jiān)管機構(gòu)的挑戰(zhàn)

今年以來,大型科技公司的投資資金如潮水般涌向人工智能初創(chuàng)企業(yè)。

今年1月,微軟向OpenAI投資了100億美元,6月又領投了Inflection的13億美元融資。今年秋天,亞馬遜宣布將向Anthropic投資40億美元。幾周后,Alphabet也不甘示弱,宣布將向Anthropic投資20億美元。與此同時,英偉達(Nvidia)可能是今年全球最多產(chǎn)的人工智能投資者,它向數(shù)十家使用其GPU的人工智能初創(chuàng)公司投入資金,其中包括Cohere、Inflection、Hugging Face、Mistral、CoreWeave、Inceptive、AI21 Labs和Imbue。

不難看出,進行這些投資的動機至少部分是為了確保這些高增長的人工智能初創(chuàng)公司成為其長期計算客戶。

這類投資可能會牽涉到會計規(guī)則中的一個重要灰色地帶。這聽起來可能是一個深奧的話題,但它將對未來人工智能領域的競爭格局產(chǎn)生巨大影響。

假設一家云計算供應商向一家人工智能初創(chuàng)企業(yè)投資1億美元,并保證這家初創(chuàng)企業(yè)會將這1億美元用于購買云計算供應商的服務。從概念上講,這對云廠商來說并不是真正的正常收入;實際上,廠商是在利用投資將自己資產(chǎn)負債表上的現(xiàn)金人為地轉(zhuǎn)化為收入。

這類交易通常被稱為“round-tripping”(因為資金出去后又馬上回來),今年引起了風險投資人比爾-格利(Bill Gurley)等硅谷領袖的關注。

細節(jié)決定成敗。并非上述所有交易都是真正的“往返”。例如,投資是否明確要求初創(chuàng)企業(yè)將資金用于投資方的產(chǎn)品,或者只是鼓勵兩家公司開展廣泛的戰(zhàn)略合作,這一點很重要。微軟與OpenAI、亞馬遜與Anthropic之間的合同并未公開,因此我們無法確定它們的結(jié)構(gòu)。

但至少在某些情況下,云計算提供商很可能通過這些投資獲得了本不該獲得的收入。

到目前為止,這些交易幾乎沒有受到任何監(jiān)管審查。這種情況將在2024年發(fā)生變化。預計明年美國證券交易委員會將對人工智能投資中的迂回交易進行更嚴厲的審查——預計此類交易的數(shù)量和規(guī)模將因此大幅下降。

鑒于云提供商是迄今為止推動人工智能熱潮的最大資金來源之一,這可能會對2024年的整體人工智能籌資環(huán)境產(chǎn)生重大影響。

08

微軟與OpenAI的關系將開始出現(xiàn)裂痕

微軟和OpenAI關系密切。迄今為止,微軟已向OpenAI投入超過100億美元。OpenAI的模型為必應、GitHub Copilot和Office 365 Copilot等微軟關鍵產(chǎn)品提供了支持。上個月,當OpenAI首席執(zhí)行官Sam Altman意外被董事會解雇時,微軟首席執(zhí)行官Satya Nadella為他的復職發(fā)揮了重要作用。

然而,微軟和OpenAI是不同的組織,對人工智能的未來有著不同的雄心壯志和長遠愿景。迄今為止,這一聯(lián)盟對兩個組織都很有利,但這只是權宜之計。這兩個組織遠非完全一致。

明年,我們預測這兩大巨頭之間的合作關系將開始出現(xiàn)裂痕。事實上,未來摩擦的蛛絲馬跡已經(jīng)開始浮出水面。

隨著OpenAI積極拓展企業(yè)業(yè)務,它將發(fā)現(xiàn)自己越來越經(jīng)常地與微軟直接爭奪客戶。就微軟而言,除了將OpenAI作為頂級人工智能模型的供應商外,它還有很多理由進行多元化發(fā)展。例如,微軟最近宣布與OpenAI的競爭對手Cohere達成合作協(xié)議。面對大規(guī)模運行OpenAI模型的高昂成本,微軟還在Phi-2等小型語言模型上投入了內(nèi)部人工智能研究。

從大的方面看,隨著人工智能變得越來越強大,有關人工智能安全、風險、監(jiān)管和公共責任的重要問題將成為焦點。利害關系將非常重大。鑒于兩家公司不同的文化、價值觀和歷史,似乎不可避免地會在處理這些問題的理念和方法上產(chǎn)生分歧。

微軟市值2.7萬億美元,是全球第二大公司。然而OpenAI及其魅力四射的領導者Sam Altman的野心可能更加深遠。如今,這兩家公司彼此合作無間。但不要指望這會永遠持續(xù)下去。

09

2023年從加密貨幣轉(zhuǎn)向人工智能的一些炒作和從眾心理行為,將在2024年重新轉(zhuǎn)向加密貨幣

現(xiàn)在很難想象風險投資家和技術領導者會對人工智能以外的東西感到興奮。但是,一年是很長的時間,風險投資人的“信念”會轉(zhuǎn)變得非??臁?/p>

加密貨幣是一個周期性行業(yè)?,F(xiàn)在它已經(jīng)過時了,但別誤會,另一輪大牛市將會到來——就像2021年、2017年和2013年一樣。如果你還沒有注意到,比特幣的價格在今年年初低于17000美元后,在過去幾個月里大幅上漲,從9月份的25000美元漲到了現(xiàn)在的40000多美元。比特幣的大漲可能正在醞釀之中,如果真的如此,大量的加密貨幣活動和炒作將隨之而來。

如今將自己定位為“全情投入”人工智能的許多知名風險投資家、企業(yè)家和技術專家,在2021-2022年的牛市期間都對加密貨幣情有獨鐘。如果明年加密資產(chǎn)價格真的飆升回來,預計他們中的一些人也會追隨這一方向的熱度,就像他們今年追隨人工智能的熱度一樣。

坦率地說,如果明年能看到一些過度的人工智能炒作轉(zhuǎn)向其他領域,那將是一個值得歡迎的發(fā)展。

10

至少有一家美國法院將裁定在互聯(lián)網(wǎng)上訓練的生成式人工智能模型構(gòu)成侵犯版權,這一問題將開始上升至美國最高法院

目前,整個生成式人工智能領域都面臨著一個被忽視的重大法律風險:世界領先的生成式人工智能模型是在大量受版權保護的內(nèi)容上訓練出來的,這一事實可能會引發(fā)巨大的法律責任,并改變該行業(yè)的經(jīng)濟狀況。

無論是GPT-4還是Claude 2中的詩歌,DALL-E 3或Midjourney中的圖像,還是Pika或Runway中的視頻,生成式人工智能模型都能產(chǎn)生令人嘆為觀止的復雜輸出,因為它們已經(jīng)在世界上的大部分數(shù)字數(shù)據(jù)上接受過訓練。在大多數(shù)情況下,人工智能公司從互聯(lián)網(wǎng)上免費獲取這些數(shù)據(jù),并隨意用于開發(fā)它們的模型。

但是,最初真正創(chuàng)造了這些知識產(chǎn)權的數(shù)百萬人——寫書、寫詩、拍照、畫畫、拍視頻的人類,對人工智能從業(yè)者是否和如何使用這些數(shù)據(jù)有發(fā)言權嗎?他們是否有權分享人工智能模型所創(chuàng)造的部分價值?

這些問題的答案將取決于法院對“合理使用”這一關鍵法律概念的解釋。合理使用是一項成熟的法律理論,已經(jīng)存在了幾個世紀。但將其應用于新生的生成式人工智能領域,會產(chǎn)生復雜的新理論問題,卻沒有明確的答案。

“斯坦福大學研究員彼得·亨德森(Peter Henderson)說:“機器學習領域的人們并不一定了解合理使用的細微差別,同時,法院已經(jīng)裁定,現(xiàn)實世界中某些備受矚目的例子不屬于受保護的合理使用,但這些例子看起來就像是人工智能正在推出的東西。”這方面的訴訟結(jié)果如何,還存在不確定性。”

這些問題將如何解決?通過個案和法院裁決。

將合理使用原則應用于生成式人工智能將是一項復雜的工作,需要創(chuàng)造性思維和主觀判斷。問題的雙方都會有可信的論據(jù)和站得住腳的結(jié)論。

因此,如果明年至少有一家美國法院裁定,像GPT-4和Midjourney這樣的生成式人工智能模型確實侵犯了版權,并且建立這些模型的公司要對訓練這些模型的知識產(chǎn)權的所有者負責,請不要感到驚訝。

這并不能解決問題。其他司法管轄區(qū)的其他美國法院面對不同的事實模式,很可能會得出相反的結(jié)論:生成式人工智能模型受到合理使用原則的保護。

這個問題會一直發(fā)展到美國最高法院,最終由最高法院給出一個結(jié)論性的法律解決方案。(通往美國最高法院的道路漫長而曲折;不要指望最高法院明年會就此問題做出裁決)。

版權所有 中華工控網(wǎng) Copyright?2024 Gkong.com, All Rights Reserved