中國自動化學(xué)會專家咨詢工作委員會指定宣傳媒體
新聞詳情
gkongbbs

用視覺傳感器代替觸覺?野生鋼鐵俠稚暉君首個機器人登場!感知+AI創(chuàng)造未來!

http://m.casecurityhq.com 2023-08-22 13:48 來源:傳感器專家網(wǎng)

8月18日上午,“野生鋼鐵俠”、“華為天才少年”、“年薪百萬離職創(chuàng)業(yè)”——頭戴這些傳奇光環(huán)的稚暉君,帶來了其創(chuàng)業(yè)以來的產(chǎn)品首秀。

而這離稚暉君從華為“出走”僅6個月,造出人行機器人——智元具身智能機器人 “遠征 A1”。

據(jù)介紹,智能機器人 “遠征 A1”融合了各種先進的本體控制、感知、認知和決策智能技術(shù),基于當前 AI 領(lǐng)域非常前沿的大語言模型,以及其自研的視覺控制模型等一系列創(chuàng)新技術(shù),將擁有出色的智能交互和任務(wù)執(zhí)行能力,未來甚至能幫我們搬磚、打螺絲、當保姆、搞科研……

從本次發(fā)布會上,我們也能窺視到天才少年稚暉君認為的未來智能,除了擁有AI人工智能的思維能力外,感知能力也是重要的一環(huán)——此前其設(shè)計的“自動”自行車、智能鍵盤、自平衡機器人等等均內(nèi)置了大量的傳感器,許多功能依賴于這些傳感器進行開發(fā)。

值得一提的是,在智能機器人 “遠征 A1”上,稚暉君創(chuàng)意地將視覺傳感器應(yīng)用于靈巧手(機器手)實現(xiàn)觸覺的壓力傳感器效果——某方面上這顯示了目前柔性傳感器技術(shù)的滯后以及對柔性傳感器的強烈需求。

下文,我們來看看稚暉君的第一個人形機器人有什么功能?搭載了什么傳感器?怎么用視覺傳感器代替觸覺壓力傳感器?

遠征A1能做什么?

首先,我們先來看看遠征A1長得咋樣?

遠征A1是一臺具有完整人類造型的人形雙足機器人。從現(xiàn)場演示來看,遠征A1走路的速度并不快,跟小米的“鐵大”較為接近,其走路的狀態(tài)還是比較穩(wěn)的,不過步幅比較小。

根據(jù)現(xiàn)場視頻,遠征A1可以在汽車產(chǎn)線中從事地盤裝配、外觀檢測。

還可以在工廠中進行3C產(chǎn)品的組裝裝配、物料搬運,在生化實驗室中幫助研究員進行樣本制備、樣本增擴。

在家庭場景中,遠征A1甚至可以在烹飪場景中磕雞蛋。

還能照顧老人、幫助老人吃藥,還能幫孩子輔導(dǎo)功課。

值得一提的是,雖然發(fā)布會上提到了各種炫酷能力,但在今天的發(fā)布會現(xiàn)場,稚暉君并沒有對這些功能進行演示。

這場發(fā)布會,也是稚暉君創(chuàng)業(yè)公司——智元機器人(Agibot)品牌的首次對外露出。

為什么要用這個名字?因為“智”代表人工智能,“元”則是下方有兩條腿的人的象形,其英文名Agibot是通用人工智能機器人的意思。

所以,智元機器人(Agibot)這家公司的初心&使命就是“創(chuàng)造出和人一樣靈活以及智能的機器人,讓智能機器創(chuàng)造無限生產(chǎn)力”,最終推動人類整個社會邁向一個更加智能、高效和可持續(xù)的未來。

“遠征 A1”到底有多牛?指尖視覺傳感器能識別壓力?RGBD相機、激光雷達、IMU等傳感器各顯神通

網(wǎng)上有個經(jīng)典的AI段子,如下圖所示:

我們想讓AI做飯、打掃房間、洗衣服晾衣服曬衣服、扔垃圾、鏟屎等,但是AI實際在做的事卻是聊天、繪畫、寫作、作曲和游戲等等……

要想讓機器人真正去做圖上左邊的事情,必須實現(xiàn)AI和機器人技術(shù)更深層次的結(jié)合,這涉及到對環(huán)境的理解、上下文的推理、物體識別、運動規(guī)劃等一系列復(fù)雜的技術(shù)挑戰(zhàn)——這并不是一個硬件或者軟件的問題,它是一個系統(tǒng)性的軟硬件算法各方面綜合的協(xié)同問題。

為此,智元團隊在軟件和硬件方面都取得了階段性的進展。

  • 人形機器人本體技術(shù)

首先來看硬件部分,也就是人形機器人本體技術(shù)。

為什么是人形?

答案其實很簡單,因為人類生活的整個物理世界就是為人的形態(tài)而設(shè)計的,包括各種場景、任務(wù)、設(shè)備、工具都是為人類量身打造的,所以人形的身體結(jié)構(gòu)和能力顯然可以幫助機器人更好地融入人類生活的環(huán)境。

當然,稚暉君也承認——

人形并不是通用機器人唯一的解決方案,在一些特定的結(jié)構(gòu)化場景中,可能其他平臺的機器人會有更高的效率和可用性,所以他們也對機器人本體進行了各種模塊化的設(shè)計。

但長遠來看,從第一性原理出發(fā),稚暉君的團隊還是認為人形機器人是在人類環(huán)境中最為通用的一種形態(tài),也是未來可以走進千家萬戶,有希望進入大家生活中的最終的終極形態(tài)。

為了實現(xiàn)機器人流暢的基礎(chǔ)行走能力和上下協(xié)同能力,在本體硬件設(shè)計方面,智元團隊在機器人全身搭載了包括諧波一體關(guān)節(jié)、直線推桿、無刷行星伺服、空心杯電機等在內(nèi)一共49個自由度,各類的執(zhí)行器。

一臺行動非常精準靈敏的機器人,它的關(guān)節(jié)需要具備一系列特征:體積小、重量輕、功率密度足夠高、能量利用效率足夠高、高響應(yīng)帶寬、耐沖擊等等…..

然后再結(jié)合機器人整機結(jié)構(gòu)設(shè)計和控制系統(tǒng)的最優(yōu)設(shè)計,才能保障其執(zhí)行的高效。

所以這個核心關(guān)節(jié)它不僅是讓人形機器人更加靈活,更加自由的關(guān)鍵,那也同時也是未來智元想要實現(xiàn)規(guī)模量產(chǎn)化,實現(xiàn)低成本制造的重要門檻之一。

為此,智元團隊自研設(shè)計了名為PowerFlow的專用關(guān)節(jié),重量僅為1.6kg,小小的體積下集成了液冷循環(huán)散熱系統(tǒng),峰值扭矩可達350Nm。

另外一個非常重要的核心零部件就是零巧手。

智元團隊自研了高自由度的靈巧手,目前擁有12個主動自由度和5個被動自由度,而且所有驅(qū)動都是內(nèi)置的,成本卻可以低至1萬元以內(nèi)。

同時,因為A1機器人應(yīng)用將瞄準一些非常精密的操作場景,所以該款靈巧手的指尖也集成了基于視覺的指尖傳感器,可以分辨操作物的顏色、形狀,甚至材質(zhì),而且可以基于各種算法的數(shù)據(jù)融合,去做到近似觸覺壓力傳感器的感知效果。

除了這兩個核心零部件之外,遠征A1的AI算力達到了200TOPS,搭載了RGBD相機、激光雷達、IMU等傳感器,在智能方面則支持多模態(tài)感知、少樣本學(xué)習(xí)、任務(wù)閉環(huán)、強人機交互等能力和特性。

有了非常良好的硬件平臺作為基礎(chǔ),運控算法也是非常核心的關(guān)鍵。據(jù)稚暉君介紹,在短短幾個月的研發(fā)實踐中,其團隊已經(jīng)快速迭代了三版運控算法,可以說其已經(jīng)擁有目前業(yè)界一梯隊的最核心的算法研發(fā)能力。

為了讓遠征AI具備真正落地的可能,智元團隊希望未來將整個機器人硬件成本控制在20萬元人民幣以內(nèi),也不知手握擎天柱機器人的馬斯克慌不慌。

  • 具身智能技術(shù)

機器人要想低成本的量產(chǎn)并產(chǎn)生實際應(yīng)用價值,硬件本體只是前置條件,更重要的則是機器人的AI大腦,也就是軟件部分。

近年來,隨著大語言模型技術(shù)的飛速發(fā)展,稚暉君認為讓機器人自主去感知環(huán)境,理解任務(wù)動作編排,自主地去完成一整套流程已經(jīng)成為了可能。

在智元團隊看來,大模型在機器人領(lǐng)域運用最大的價值體現(xiàn)在兩點:

第一點是“龐大的先驗知識庫&強大的通識理解能力”。

舉例而言,當我們需要讓機器人把桌子上的垃圾扔到旁邊的垃圾桶里,我們不再需要去告訴他垃圾是啥,垃圾桶是啥。所有的這些數(shù)據(jù),都是預(yù)訓(xùn)練的 GPT 模型從海量物聯(lián)網(wǎng)數(shù)據(jù)中已經(jīng)學(xué)到的概念,所以大模型的出現(xiàn)可以使得機器人把原有的能力更好地泛化到它沒有見過的場景中。

第二點是“復(fù)雜語義多級推理能力,所謂的思維鏈”。

如下圖所示,如果我們需要指令機器人將“藍色的方塊放在紅色方塊下面”,那么機器人就得理解重力是怎么回事,因為東西不會飄在空中,他要怎么進行一個多級的操作來完成這樣一個復(fù)雜的任務(wù)?

所以在大模型時代到來之前,機器人都是專用設(shè)備,我們需要針對性地對每一個任務(wù)進行調(diào)試和部署,而如今利用大模型的各種通識能力和舉一反三的推理能力,我們可以看到解決這些問題,最終走向通用機器人的一道曙光。

基于此,智元設(shè)置了“具身智腦”EI-Brain框架,把機器人的思維系統(tǒng)分為四個層級,分別是云端超腦、大腦、小腦和腦干。

講完技術(shù)后,稚暉君也用一段視頻展示了人形機器人在各個場景里面應(yīng)用的無限潛力。

據(jù)悉,“遠征A1”將首先用于新能源制造、3C制造,目前已經(jīng)與頭部企業(yè)進行對接。但具體品牌名,尚未透露。

“天才少年”離職創(chuàng)業(yè)史,自動平衡自行車火遍全網(wǎng),搭載多種傳感器模塊

公開資料顯示:稚暉君,真名彭志輝,2018年畢業(yè)于電子科技大學(xué)信通學(xué)院。

2018年畢業(yè)后,他曾就職于OPPO研究院AI實驗室擔(dān)任算法工程師,后受邀通過天才少年計劃加入華為,從事昇騰AI芯片和AI算法相關(guān)研究工作,年薪百萬。

能加入“華為天才少年計劃”,就已經(jīng)很能說明其實力之牛了。該計劃對申請者具有極高的要求:國際頂刊論文發(fā)表數(shù)量及引用量豐富者;研究方向有出色及豐富的商業(yè)化成果;有知名賽事名次者優(yōu)先。與之相對的招聘流程亦非常嚴格,一般需要經(jīng)歷7輪左右流程,最終還要通過華為總裁的面試。

與其他那些神秘天才不同,稚暉君是一位活躍于網(wǎng)絡(luò)的大V,他所做的許多研究也都公布在了網(wǎng)上,相信不少科技愛好者都在B站上刷到過他的視頻。

比如這輛硬核自行車,它不但能夠自己穩(wěn)穩(wěn)站立,還能夠自動行走、躲避障礙物,甚至還能自己拐彎……

據(jù)網(wǎng)傳硬件清單中,這臺自動自行車集成了陀螺儀加速度計模塊、超聲波模塊、距離傳感器、攝像頭 Motion Sensor(紅外傳感器)等多種傳感器模塊,以實現(xiàn)各種自平衡等各種功能。

還有這臺鋼鐵俠的機械臂,稚暉君遠程操控其為一顆破口葡萄縫針,葡萄未被機械臂損壞。

在“葡萄包扎術(shù)”后,原本裂開小口的它,變成了這個樣子:

以及稚暉君“鴿”到今年4月在B站分享自制的“輪足”機器人哪吒,簡直就是“國風(fēng)神話”和“賽博機械”的組合~

網(wǎng)友驚嘆稚暉君的恐怖之處在于:一個人完成了所有細節(jié),建模,算法,電路設(shè)計,驅(qū)動設(shè)計,APP開發(fā),知識儲備量和動手實踐能力恐怖如斯!

完成了許多創(chuàng)舉的稚暉君本身則比較謙虛,他自己在很多采訪里都表達過“我覺得我既不是天才,也已經(jīng)不是少年了”,自己只是個很愛折騰的極客而已。

去年12月,稚暉君正式確認離開華為,表示自己接下來會開啟一段新的事業(yè)。雖然華為內(nèi)部也曾挽留,但顯然這種級別的天才是很難在大廠做一顆“螺絲釘”的。

今年2月,稚暉君的創(chuàng)業(yè)公司智元機器人(Agibot)正式成立。

據(jù)悉,智元機器人(Agibot)是一家專注于發(fā)展通用人形機器人和具身智能的公司,致力于以A1和機器人的深度融合,長期投入打造有競爭力的機器人產(chǎn)品和生態(tài)。

截至目前,智元機器人(Agibot)已經(jīng)完成了第三輪融資,市場估值被曝在十幾億美元左右。

幾個月前,稚暉君也在微博上發(fā)了招聘貼,表示人工智能正在迎來新一輪產(chǎn)業(yè)劇變,往AGI圣杯的方向加速邁進,LLM+Robotics的組合已是必然趨勢,機器人將在不久的未來迎來應(yīng)用場景爆發(fā)的拐點,希望更多人加入他們這個年輕的團隊,一起擁抱AI世界的星辰大海。

具身人形機器人才是未來?

就今天發(fā)布的新品來看,稚暉君選擇的方向是具身人形機器人。

所謂具身智能,就是Embodied Intelligence,簡稱EI,圖靈于1950年在論文《Computing Machinery and Intelligence》中第一次提出這一概念。具身智能可以讓機器像人一樣能和環(huán)境交互感知,自主規(guī)劃、決策、行動,并具備執(zhí)行能力,也被認為是AI的終極形態(tài)。

知名美籍華裔人工智能學(xué)者李飛飛曾經(jīng)直言,具身智能將會成為AI領(lǐng)域的下一個“北極星問題”之一。而英偉達首席執(zhí)行官黃仁勛也表達過類似的觀點,稱“AI的下一個浪潮將是具身智能”。

就在今年7月,李飛飛帶隊的項目組,發(fā)布了一項最新的“具身智能”成果——VoxPoser。

其原理就是使用者給定執(zhí)行具體需求的自然語言指令,以及環(huán)境信息(通過相機采集的RGB-D的圖像),然后,LLM(Large Language Model,大語言模型)將根據(jù)以上信息生成與VLM(Visual Language Model,視覺-語言模型)交互的代碼。

基于這一系列操作,系統(tǒng)會自動生成相應(yīng)的供機器人進行空間感知的“3D Value Map”(3D值圖)。它會“告訴”機器人自己在哪里、目標在哪里。

這一成果的最大亮點在于——整個機器人訓(xùn)練過程是不需要進行任何額外的數(shù)據(jù)投喂和預(yù)訓(xùn)練的。換而言之,目前機器人訓(xùn)練所需要進行的預(yù)定義訓(xùn)練、大規(guī)模數(shù)據(jù)缺失等問題,在這里統(tǒng)統(tǒng)不存在。

正是因為具備上述能力,機器人只要符合相關(guān)流程,也基本能夠完成任何給定任務(wù)。

關(guān)于VoxPoser這項成果,可以說又是人工智能領(lǐng)域和機器人領(lǐng)域融合的一個新的里程碑!

而在機器人形態(tài)方面,智元團隊也認可人形機器人才是終極目標。

我們熟悉的馬斯克就是人形機器人的忠實擁躉。

在前不久的二季度業(yè)績說明會上,特斯拉CEO埃隆·馬斯克公布了備受關(guān)注的特斯拉人形機器人Optimus的最新進展。馬斯克表示,特斯拉已經(jīng)生產(chǎn)了10臺人形機器人。預(yù)計在今年11月份進行行走測試,計劃明年在特斯拉工廠進行實用性測試。

除了特斯拉,小米也研發(fā)了其首個全尺寸人形仿生機器人“CyberOne”,中文名“鐵大”。整機高為1.77米,重量為52KG,跟正常的成人一般大小。

據(jù)雷軍介紹,“鐵大”擁有和人類一樣的高智商,它能感知45種人類語義情緒,分辨85種環(huán)境語義。“鐵大”采用了小米全自研全身控制算法,協(xié)調(diào)運動21個關(guān)節(jié)自由度,全身5種關(guān)節(jié)驅(qū)動,峰值扭矩可達300Nm;在視覺方面,通過Mi Sense視覺空間系統(tǒng)加持,“鐵大”具備三維重建真實世界的能力。

不久前的WRC 2023上,知名機器人公司優(yōu)必選則對外發(fā)布了人形機器人智能多模態(tài)交互系統(tǒng),這是一個集人機交互、指令理解、自主規(guī)劃、任務(wù)執(zhí)行等技術(shù)于一體的智能系統(tǒng)。

優(yōu)必選科技在展臺上還展示了熊貓機器人優(yōu)悠和Walker X,它們都是剛從成都大運會閉幕式趕赴北京的騎過平衡車的大型人形機器人。

總體來看,人形機器人已經(jīng)站上了風(fēng)口。未來,具身智能+人形將成為一個大殺器。

寫在最后

發(fā)布會的最后,稚暉君通過一段視頻展示了智元這個富有活力的團隊~

創(chuàng)業(yè)維艱,但是熱愛的熱情似乎可以克服一切阻力。

在談到自己的夢想時,稚暉君說道:

“我的夢想之一,就是希望有一天能夠讓科幻電影里的智能機器人真正變?yōu)楝F(xiàn)實,這些機器人不再是簡單的機械裝置,而是擁有自主思考能力和學(xué)習(xí)能力的伙伴,能夠感知和理解我們的世界,然后與我們進行深入的溝通和合作。”

致敬每一個追夢人

也期待未來遠征AI的更多驚喜!

版權(quán)所有 中華工控網(wǎng) Copyright?2024 Gkong.com, All Rights Reserved