http://m.casecurityhq.com 2024-06-26 11:04 來源:金臺資訊
6月24日,成都人形機(jī)器人創(chuàng)新中心發(fā)布了中國首個基于視覺擴(kuò)散架構(gòu)的人形機(jī)器人任務(wù)生成式模型R-DDPRM,該模型能讓機(jī)器人毫不猶豫“絲滑”地處理各種復(fù)雜任務(wù),這是人形機(jī)器人進(jìn)化史上的重大核心技術(shù)突破。
“成都人形機(jī)器人創(chuàng)新中心致力于打造具有國際領(lǐng)先水平的‘有腦子’的人形機(jī)器人。”成都人形機(jī)器人創(chuàng)新中心有限公司負(fù)責(zé)人張睿睿表示:“此前大家所熟知的一些模型是基于擴(kuò)散架構(gòu)的垂直模型,它們無一例外都擁有強(qiáng)大的理解、推理和生成能力。擴(kuò)散架構(gòu)應(yīng)用于人形機(jī)器人核心技術(shù)研發(fā)是全球人工智能最新最尖端領(lǐng)域,將重構(gòu)人形機(jī)器人底層架構(gòu),釋放人形機(jī)器人的決策技能,使其在操縱和泛化方面達(dá)到前所未有的高度。目前全球范圍內(nèi)僅特斯拉、麻省理工+哥倫比亞大學(xué)聯(lián)合團(tuán)隊等人形機(jī)器人國際頂尖團(tuán)隊發(fā)布了相關(guān)階段性成果。”
“目前業(yè)界的人形機(jī)器人任務(wù)生成式模型主要基于VAE、AC Transformer、LSTM等架構(gòu),但這類架構(gòu)下的人形機(jī)器人通常在規(guī)劃動作時考慮單一約束類型,例如物體抓持穩(wěn)定性或規(guī)避障礙物路徑規(guī)劃,這就需要針對每種細(xì)分情況都要對應(yīng)開發(fā)和執(zhí)行一系列單獨(dú)的垂直模型(并聯(lián)線性),遇到執(zhí)行問題需要局部調(diào)整試錯來緩慢推進(jìn)任務(wù)進(jìn)程,推理效率低、執(zhí)行速度慢且大量消耗算力。”張睿睿介紹,成都人形機(jī)器人創(chuàng)新中心首發(fā)的R-DDPRM模型能夠讓人形機(jī)器人跨越多個約束進(jìn)行泛化,創(chuàng)造了真正的人形機(jī)器人“大腦”——能夠毫不猶豫“絲滑”地處理各種復(fù)雜任務(wù)。
該模型具有同時確定拿起物體的最佳抓持位姿、移動物體最佳路線、能耗最少最佳等多要素全局規(guī)劃思維能力。而且能夠在人為破壞任務(wù)進(jìn)程時迅速進(jìn)行決策修正和調(diào)整執(zhí)行方式,接續(xù)完成任務(wù),該模型的泛化能力能讓人形機(jī)器人自主流暢完成從整理房間到復(fù)雜外科手術(shù)等各種復(fù)雜任務(wù)。
據(jù)介紹,R-DDPRM任務(wù)生成式模型具有更加穩(wěn)定、任務(wù)執(zhí)行成功率大幅提升、決策更敏捷、算力依賴度幾何級降低(理論上中等消費(fèi)級顯卡在端上即可完成人形機(jī)器人絕大部分任務(wù))、處理復(fù)雜場景任務(wù)的能力更強(qiáng)等絕對優(yōu)勢,將極大提升人形機(jī)器人的任務(wù)執(zhí)行能力和效率,降低算力和能耗成本。
“此次R-DDPRM的發(fā)布,將實(shí)現(xiàn)人形機(jī)器人在任務(wù)生成上從并聯(lián)線性推理到敏捷全局泛化推理的質(zhì)的飛躍,這是人形機(jī)器人領(lǐng)域的突破性成果,將重新定義人形機(jī)器人推理和任務(wù)規(guī)劃的底層邏輯。”張睿睿說。