中國自動(dòng)化學(xué)會(huì)專家咨詢工作委員會(huì)指定宣傳媒體
新聞詳情
gkongbbs

用視覺傳感器代替觸覺?野生鋼鐵俠稚暉君首個(gè)機(jī)器人登場(chǎng)!感知+AI創(chuàng)造未來!

http://m.casecurityhq.com 2023-08-22 13:48 來源:傳感器專家網(wǎng)

8月18日上午,“野生鋼鐵俠”、“華為天才少年”、“年薪百萬離職創(chuàng)業(yè)”——頭戴這些傳奇光環(huán)的稚暉君,帶來了其創(chuàng)業(yè)以來的產(chǎn)品首秀。

而這離稚暉君從華為“出走”僅6個(gè)月,造出人行機(jī)器人——智元具身智能機(jī)器人 “遠(yuǎn)征 A1”。

據(jù)介紹,智能機(jī)器人 “遠(yuǎn)征 A1”融合了各種先進(jìn)的本體控制、感知、認(rèn)知和決策智能技術(shù),基于當(dāng)前 AI 領(lǐng)域非常前沿的大語言模型,以及其自研的視覺控制模型等一系列創(chuàng)新技術(shù),將擁有出色的智能交互和任務(wù)執(zhí)行能力,未來甚至能幫我們搬磚、打螺絲、當(dāng)保姆、搞科研……

從本次發(fā)布會(huì)上,我們也能窺視到天才少年稚暉君認(rèn)為的未來智能,除了擁有AI人工智能的思維能力外,感知能力也是重要的一環(huán)——此前其設(shè)計(jì)的“自動(dòng)”自行車、智能鍵盤、自平衡機(jī)器人等等均內(nèi)置了大量的傳感器,許多功能依賴于這些傳感器進(jìn)行開發(fā)。

值得一提的是,在智能機(jī)器人 “遠(yuǎn)征 A1”上,稚暉君創(chuàng)意地將視覺傳感器應(yīng)用于靈巧手(機(jī)器手)實(shí)現(xiàn)觸覺的壓力傳感器效果——某方面上這顯示了目前柔性傳感器技術(shù)的滯后以及對(duì)柔性傳感器的強(qiáng)烈需求。

下文,我們來看看稚暉君的第一個(gè)人形機(jī)器人有什么功能?搭載了什么傳感器?怎么用視覺傳感器代替觸覺壓力傳感器?

遠(yuǎn)征A1能做什么?

首先,我們先來看看遠(yuǎn)征A1長得咋樣?

遠(yuǎn)征A1是一臺(tái)具有完整人類造型的人形雙足機(jī)器人。從現(xiàn)場(chǎng)演示來看,遠(yuǎn)征A1走路的速度并不快,跟小米的“鐵大”較為接近,其走路的狀態(tài)還是比較穩(wěn)的,不過步幅比較小。

根據(jù)現(xiàn)場(chǎng)視頻,遠(yuǎn)征A1可以在汽車產(chǎn)線中從事地盤裝配、外觀檢測(cè)。

還可以在工廠中進(jìn)行3C產(chǎn)品的組裝裝配、物料搬運(yùn),在生化實(shí)驗(yàn)室中幫助研究員進(jìn)行樣本制備、樣本增擴(kuò)。

在家庭場(chǎng)景中,遠(yuǎn)征A1甚至可以在烹飪場(chǎng)景中磕雞蛋。

還能照顧老人、幫助老人吃藥,還能幫孩子輔導(dǎo)功課。

值得一提的是,雖然發(fā)布會(huì)上提到了各種炫酷能力,但在今天的發(fā)布會(huì)現(xiàn)場(chǎng),稚暉君并沒有對(duì)這些功能進(jìn)行演示。

這場(chǎng)發(fā)布會(huì),也是稚暉君創(chuàng)業(yè)公司——智元機(jī)器人(Agibot)品牌的首次對(duì)外露出。

為什么要用這個(gè)名字?因?yàn)?ldquo;智”代表人工智能,“元”則是下方有兩條腿的人的象形,其英文名Agibot是通用人工智能機(jī)器人的意思。

所以,智元機(jī)器人(Agibot)這家公司的初心&使命就是“創(chuàng)造出和人一樣靈活以及智能的機(jī)器人,讓智能機(jī)器創(chuàng)造無限生產(chǎn)力”,最終推動(dòng)人類整個(gè)社會(huì)邁向一個(gè)更加智能、高效和可持續(xù)的未來。

“遠(yuǎn)征 A1”到底有多牛?指尖視覺傳感器能識(shí)別壓力?RGBD相機(jī)、激光雷達(dá)、IMU等傳感器各顯神通

網(wǎng)上有個(gè)經(jīng)典的AI段子,如下圖所示:

我們想讓AI做飯、打掃房間、洗衣服晾衣服曬衣服、扔垃圾、鏟屎等,但是AI實(shí)際在做的事卻是聊天、繪畫、寫作、作曲和游戲等等……

要想讓機(jī)器人真正去做圖上左邊的事情,必須實(shí)現(xiàn)AI和機(jī)器人技術(shù)更深層次的結(jié)合,這涉及到對(duì)環(huán)境的理解、上下文的推理、物體識(shí)別、運(yùn)動(dòng)規(guī)劃等一系列復(fù)雜的技術(shù)挑戰(zhàn)——這并不是一個(gè)硬件或者軟件的問題,它是一個(gè)系統(tǒng)性的軟硬件算法各方面綜合的協(xié)同問題。

為此,智元團(tuán)隊(duì)在軟件和硬件方面都取得了階段性的進(jìn)展。

  • 人形機(jī)器人本體技術(shù)

首先來看硬件部分,也就是人形機(jī)器人本體技術(shù)。

為什么是人形?

答案其實(shí)很簡(jiǎn)單,因?yàn)槿祟惿畹恼麄€(gè)物理世界就是為人的形態(tài)而設(shè)計(jì)的,包括各種場(chǎng)景、任務(wù)、設(shè)備、工具都是為人類量身打造的,所以人形的身體結(jié)構(gòu)和能力顯然可以幫助機(jī)器人更好地融入人類生活的環(huán)境。

當(dāng)然,稚暉君也承認(rèn)——

人形并不是通用機(jī)器人唯一的解決方案,在一些特定的結(jié)構(gòu)化場(chǎng)景中,可能其他平臺(tái)的機(jī)器人會(huì)有更高的效率和可用性,所以他們也對(duì)機(jī)器人本體進(jìn)行了各種模塊化的設(shè)計(jì)。

但長遠(yuǎn)來看,從第一性原理出發(fā),稚暉君的團(tuán)隊(duì)還是認(rèn)為人形機(jī)器人是在人類環(huán)境中最為通用的一種形態(tài),也是未來可以走進(jìn)千家萬戶,有希望進(jìn)入大家生活中的最終的終極形態(tài)。

為了實(shí)現(xiàn)機(jī)器人流暢的基礎(chǔ)行走能力和上下協(xié)同能力,在本體硬件設(shè)計(jì)方面,智元團(tuán)隊(duì)在機(jī)器人全身搭載了包括諧波一體關(guān)節(jié)、直線推桿、無刷行星伺服、空心杯電機(jī)等在內(nèi)一共49個(gè)自由度,各類的執(zhí)行器。

一臺(tái)行動(dòng)非常精準(zhǔn)靈敏的機(jī)器人,它的關(guān)節(jié)需要具備一系列特征:體積小、重量輕、功率密度足夠高、能量利用效率足夠高、高響應(yīng)帶寬、耐沖擊等等…..

然后再結(jié)合機(jī)器人整機(jī)結(jié)構(gòu)設(shè)計(jì)和控制系統(tǒng)的最優(yōu)設(shè)計(jì),才能保障其執(zhí)行的高效。

所以這個(gè)核心關(guān)節(jié)它不僅是讓人形機(jī)器人更加靈活,更加自由的關(guān)鍵,那也同時(shí)也是未來智元想要實(shí)現(xiàn)規(guī)模量產(chǎn)化,實(shí)現(xiàn)低成本制造的重要門檻之一。

為此,智元團(tuán)隊(duì)自研設(shè)計(jì)了名為PowerFlow的專用關(guān)節(jié),重量?jī)H為1.6kg,小小的體積下集成了液冷循環(huán)散熱系統(tǒng),峰值扭矩可達(dá)350Nm。

另外一個(gè)非常重要的核心零部件就是零巧手。

智元團(tuán)隊(duì)自研了高自由度的靈巧手,目前擁有12個(gè)主動(dòng)自由度和5個(gè)被動(dòng)自由度,而且所有驅(qū)動(dòng)都是內(nèi)置的,成本卻可以低至1萬元以內(nèi)。

同時(shí),因?yàn)锳1機(jī)器人應(yīng)用將瞄準(zhǔn)一些非常精密的操作場(chǎng)景,所以該款靈巧手的指尖也集成了基于視覺的指尖傳感器,可以分辨操作物的顏色、形狀,甚至材質(zhì),而且可以基于各種算法的數(shù)據(jù)融合,去做到近似觸覺壓力傳感器的感知效果。

除了這兩個(gè)核心零部件之外,遠(yuǎn)征A1的AI算力達(dá)到了200TOPS,搭載了RGBD相機(jī)、激光雷達(dá)、IMU等傳感器,在智能方面則支持多模態(tài)感知、少樣本學(xué)習(xí)、任務(wù)閉環(huán)、強(qiáng)人機(jī)交互等能力和特性。

有了非常良好的硬件平臺(tái)作為基礎(chǔ),運(yùn)控算法也是非常核心的關(guān)鍵。據(jù)稚暉君介紹,在短短幾個(gè)月的研發(fā)實(shí)踐中,其團(tuán)隊(duì)已經(jīng)快速迭代了三版運(yùn)控算法,可以說其已經(jīng)擁有目前業(yè)界一梯隊(duì)的最核心的算法研發(fā)能力。

為了讓遠(yuǎn)征AI具備真正落地的可能,智元團(tuán)隊(duì)希望未來將整個(gè)機(jī)器人硬件成本控制在20萬元人民幣以內(nèi),也不知手握擎天柱機(jī)器人的馬斯克慌不慌。

  • 具身智能技術(shù)

機(jī)器人要想低成本的量產(chǎn)并產(chǎn)生實(shí)際應(yīng)用價(jià)值,硬件本體只是前置條件,更重要的則是機(jī)器人的AI大腦,也就是軟件部分。

近年來,隨著大語言模型技術(shù)的飛速發(fā)展,稚暉君認(rèn)為讓機(jī)器人自主去感知環(huán)境,理解任務(wù)動(dòng)作編排,自主地去完成一整套流程已經(jīng)成為了可能。

在智元團(tuán)隊(duì)看來,大模型在機(jī)器人領(lǐng)域運(yùn)用最大的價(jià)值體現(xiàn)在兩點(diǎn):

第一點(diǎn)是“龐大的先驗(yàn)知識(shí)庫&強(qiáng)大的通識(shí)理解能力”。

舉例而言,當(dāng)我們需要讓機(jī)器人把桌子上的垃圾扔到旁邊的垃圾桶里,我們不再需要去告訴他垃圾是啥,垃圾桶是啥。所有的這些數(shù)據(jù),都是預(yù)訓(xùn)練的 GPT 模型從海量物聯(lián)網(wǎng)數(shù)據(jù)中已經(jīng)學(xué)到的概念,所以大模型的出現(xiàn)可以使得機(jī)器人把原有的能力更好地泛化到它沒有見過的場(chǎng)景中。

第二點(diǎn)是“復(fù)雜語義多級(jí)推理能力,所謂的思維鏈”。

如下圖所示,如果我們需要指令機(jī)器人將“藍(lán)色的方塊放在紅色方塊下面”,那么機(jī)器人就得理解重力是怎么回事,因?yàn)闁|西不會(huì)飄在空中,他要怎么進(jìn)行一個(gè)多級(jí)的操作來完成這樣一個(gè)復(fù)雜的任務(wù)?

所以在大模型時(shí)代到來之前,機(jī)器人都是專用設(shè)備,我們需要針對(duì)性地對(duì)每一個(gè)任務(wù)進(jìn)行調(diào)試和部署,而如今利用大模型的各種通識(shí)能力和舉一反三的推理能力,我們可以看到解決這些問題,最終走向通用機(jī)器人的一道曙光。

基于此,智元設(shè)置了“具身智腦”EI-Brain框架,把機(jī)器人的思維系統(tǒng)分為四個(gè)層級(jí),分別是云端超腦、大腦、小腦和腦干。

講完技術(shù)后,稚暉君也用一段視頻展示了人形機(jī)器人在各個(gè)場(chǎng)景里面應(yīng)用的無限潛力。

據(jù)悉,“遠(yuǎn)征A1”將首先用于新能源制造、3C制造,目前已經(jīng)與頭部企業(yè)進(jìn)行對(duì)接。但具體品牌名,尚未透露。

“天才少年”離職創(chuàng)業(yè)史,自動(dòng)平衡自行車火遍全網(wǎng),搭載多種傳感器模塊

公開資料顯示:稚暉君,真名彭志輝,2018年畢業(yè)于電子科技大學(xué)信通學(xué)院。

2018年畢業(yè)后,他曾就職于OPPO研究院AI實(shí)驗(yàn)室擔(dān)任算法工程師,后受邀通過天才少年計(jì)劃加入華為,從事昇騰AI芯片和AI算法相關(guān)研究工作,年薪百萬。

能加入“華為天才少年計(jì)劃”,就已經(jīng)很能說明其實(shí)力之牛了。該計(jì)劃對(duì)申請(qǐng)者具有極高的要求:國際頂刊論文發(fā)表數(shù)量及引用量豐富者;研究方向有出色及豐富的商業(yè)化成果;有知名賽事名次者優(yōu)先。與之相對(duì)的招聘流程亦非常嚴(yán)格,一般需要經(jīng)歷7輪左右流程,最終還要通過華為總裁的面試。

與其他那些神秘天才不同,稚暉君是一位活躍于網(wǎng)絡(luò)的大V,他所做的許多研究也都公布在了網(wǎng)上,相信不少科技愛好者都在B站上刷到過他的視頻。

比如這輛硬核自行車,它不但能夠自己穩(wěn)穩(wěn)站立,還能夠自動(dòng)行走、躲避障礙物,甚至還能自己拐彎……

據(jù)網(wǎng)傳硬件清單中,這臺(tái)自動(dòng)自行車集成了陀螺儀加速度計(jì)模塊、超聲波模塊、距離傳感器、攝像頭 Motion Sensor(紅外傳感器)等多種傳感器模塊,以實(shí)現(xiàn)各種自平衡等各種功能。

還有這臺(tái)鋼鐵俠的機(jī)械臂,稚暉君遠(yuǎn)程操控其為一顆破口葡萄縫針,葡萄未被機(jī)械臂損壞。

在“葡萄包扎術(shù)”后,原本裂開小口的它,變成了這個(gè)樣子:

以及稚暉君“鴿”到今年4月在B站分享自制的“輪足”機(jī)器人哪吒,簡(jiǎn)直就是“國風(fēng)神話”和“賽博機(jī)械”的組合~

網(wǎng)友驚嘆稚暉君的恐怖之處在于:一個(gè)人完成了所有細(xì)節(jié),建模,算法,電路設(shè)計(jì),驅(qū)動(dòng)設(shè)計(jì),APP開發(fā),知識(shí)儲(chǔ)備量和動(dòng)手實(shí)踐能力恐怖如斯!

完成了許多創(chuàng)舉的稚暉君本身則比較謙虛,他自己在很多采訪里都表達(dá)過“我覺得我既不是天才,也已經(jīng)不是少年了”,自己只是個(gè)很愛折騰的極客而已。

去年12月,稚暉君正式確認(rèn)離開華為,表示自己接下來會(huì)開啟一段新的事業(yè)。雖然華為內(nèi)部也曾挽留,但顯然這種級(jí)別的天才是很難在大廠做一顆“螺絲釘”的。

今年2月,稚暉君的創(chuàng)業(yè)公司智元機(jī)器人(Agibot)正式成立。

據(jù)悉,智元機(jī)器人(Agibot)是一家專注于發(fā)展通用人形機(jī)器人和具身智能的公司,致力于以A1和機(jī)器人的深度融合,長期投入打造有競(jìng)爭(zhēng)力的機(jī)器人產(chǎn)品和生態(tài)。

截至目前,智元機(jī)器人(Agibot)已經(jīng)完成了第三輪融資,市場(chǎng)估值被曝在十幾億美元左右。

幾個(gè)月前,稚暉君也在微博上發(fā)了招聘貼,表示人工智能正在迎來新一輪產(chǎn)業(yè)劇變,往AGI圣杯的方向加速邁進(jìn),LLM+Robotics的組合已是必然趨勢(shì),機(jī)器人將在不久的未來迎來應(yīng)用場(chǎng)景爆發(fā)的拐點(diǎn),希望更多人加入他們這個(gè)年輕的團(tuán)隊(duì),一起擁抱AI世界的星辰大海。

具身人形機(jī)器人才是未來?

就今天發(fā)布的新品來看,稚暉君選擇的方向是具身人形機(jī)器人。

所謂具身智能,就是Embodied Intelligence,簡(jiǎn)稱EI,圖靈于1950年在論文《Computing Machinery and Intelligence》中第一次提出這一概念。具身智能可以讓機(jī)器像人一樣能和環(huán)境交互感知,自主規(guī)劃、決策、行動(dòng),并具備執(zhí)行能力,也被認(rèn)為是AI的終極形態(tài)。

知名美籍華裔人工智能學(xué)者李飛飛曾經(jīng)直言,具身智能將會(huì)成為AI領(lǐng)域的下一個(gè)“北極星問題”之一。而英偉達(dá)首席執(zhí)行官黃仁勛也表達(dá)過類似的觀點(diǎn),稱“AI的下一個(gè)浪潮將是具身智能”。

就在今年7月,李飛飛帶隊(duì)的項(xiàng)目組,發(fā)布了一項(xiàng)最新的“具身智能”成果——VoxPoser。

其原理就是使用者給定執(zhí)行具體需求的自然語言指令,以及環(huán)境信息(通過相機(jī)采集的RGB-D的圖像),然后,LLM(Large Language Model,大語言模型)將根據(jù)以上信息生成與VLM(Visual Language Model,視覺-語言模型)交互的代碼。

基于這一系列操作,系統(tǒng)會(huì)自動(dòng)生成相應(yīng)的供機(jī)器人進(jìn)行空間感知的“3D Value Map”(3D值圖)。它會(huì)“告訴”機(jī)器人自己在哪里、目標(biāo)在哪里。

這一成果的最大亮點(diǎn)在于——整個(gè)機(jī)器人訓(xùn)練過程是不需要進(jìn)行任何額外的數(shù)據(jù)投喂和預(yù)訓(xùn)練的。換而言之,目前機(jī)器人訓(xùn)練所需要進(jìn)行的預(yù)定義訓(xùn)練、大規(guī)模數(shù)據(jù)缺失等問題,在這里統(tǒng)統(tǒng)不存在。

正是因?yàn)榫邆渖鲜瞿芰?,機(jī)器人只要符合相關(guān)流程,也基本能夠完成任何給定任務(wù)。

關(guān)于VoxPoser這項(xiàng)成果,可以說又是人工智能領(lǐng)域和機(jī)器人領(lǐng)域融合的一個(gè)新的里程碑!

而在機(jī)器人形態(tài)方面,智元團(tuán)隊(duì)也認(rèn)可人形機(jī)器人才是終極目標(biāo)。

我們熟悉的馬斯克就是人形機(jī)器人的忠實(shí)擁躉。

在前不久的二季度業(yè)績(jī)說明會(huì)上,特斯拉CEO埃隆·馬斯克公布了備受關(guān)注的特斯拉人形機(jī)器人Optimus的最新進(jìn)展。馬斯克表示,特斯拉已經(jīng)生產(chǎn)了10臺(tái)人形機(jī)器人。預(yù)計(jì)在今年11月份進(jìn)行行走測(cè)試,計(jì)劃明年在特斯拉工廠進(jìn)行實(shí)用性測(cè)試。

除了特斯拉,小米也研發(fā)了其首個(gè)全尺寸人形仿生機(jī)器人“CyberOne”,中文名“鐵大”。整機(jī)高為1.77米,重量為52KG,跟正常的成人一般大小。

據(jù)雷軍介紹,“鐵大”擁有和人類一樣的高智商,它能感知45種人類語義情緒,分辨85種環(huán)境語義。“鐵大”采用了小米全自研全身控制算法,協(xié)調(diào)運(yùn)動(dòng)21個(gè)關(guān)節(jié)自由度,全身5種關(guān)節(jié)驅(qū)動(dòng),峰值扭矩可達(dá)300Nm;在視覺方面,通過Mi Sense視覺空間系統(tǒng)加持,“鐵大”具備三維重建真實(shí)世界的能力。

不久前的WRC 2023上,知名機(jī)器人公司優(yōu)必選則對(duì)外發(fā)布了人形機(jī)器人智能多模態(tài)交互系統(tǒng),這是一個(gè)集人機(jī)交互、指令理解、自主規(guī)劃、任務(wù)執(zhí)行等技術(shù)于一體的智能系統(tǒng)。

優(yōu)必選科技在展臺(tái)上還展示了熊貓機(jī)器人優(yōu)悠和Walker X,它們都是剛從成都大運(yùn)會(huì)閉幕式趕赴北京的騎過平衡車的大型人形機(jī)器人。

總體來看,人形機(jī)器人已經(jīng)站上了風(fēng)口。未來,具身智能+人形將成為一個(gè)大殺器。

寫在最后

發(fā)布會(huì)的最后,稚暉君通過一段視頻展示了智元這個(gè)富有活力的團(tuán)隊(duì)~

創(chuàng)業(yè)維艱,但是熱愛的熱情似乎可以克服一切阻力。

在談到自己的夢(mèng)想時(shí),稚暉君說道:

“我的夢(mèng)想之一,就是希望有一天能夠讓科幻電影里的智能機(jī)器人真正變?yōu)楝F(xiàn)實(shí),這些機(jī)器人不再是簡(jiǎn)單的機(jī)械裝置,而是擁有自主思考能力和學(xué)習(xí)能力的伙伴,能夠感知和理解我們的世界,然后與我們進(jìn)行深入的溝通和合作。”

致敬每一個(gè)追夢(mèng)人

也期待未來遠(yuǎn)征AI的更多驚喜!

版權(quán)所有 中華工控網(wǎng) Copyright?2024 Gkong.com, All Rights Reserved