既能上春晚扭秧歌,又能模仿科比的后仰跳投、復(fù)現(xiàn) C 羅的騰空半轉(zhuǎn)身。 前陣子,宇樹科技的人形機器人,可謂是出盡了風頭。 結(jié)果這還沒幾天,他們家的機器人就又雙叒進化了。 梅花樁挑戰(zhàn),沒有一步踩空,走得穩(wěn)穩(wěn)當當。 不光能正著走,倒著走也如履平地,這換個真人來都不一定能做到好吧。。。 平衡木雖說走出了一種喝醉的感覺,但好歹也沒摔。 還有更酷炫的,舞一曲哪吒的《 天雷滾滾我好怕怕 》 指望以后機器人給養(yǎng)老的,看看 G1 現(xiàn)在也開始學推輪椅了。 夸張點,要是 G1 按照這一月好幾次進化的速度,或許明年就能進咱家當保姆了。 不過說起來,這些新技能,其實并不是宇樹的員工親手調(diào)教出來的。 像前面挑戰(zhàn)梅花樁的 G1 ,就是上海 AI 實驗室聯(lián)合了國內(nèi)好幾所頂尖大學,一起研究出來的成果。而那個蹭了哪吒熱度的 G1 ,也是出自上海 AI 實驗室等機構(gòu)之手。 所以世超這次也研究了一波兩篇論文,發(fā)現(xiàn)這倆研究一個能讓人形機器人挑戰(zhàn)高難度地形,另外一個,則是把遠程控制機器人的成本打了下來。 可以說這倆研究成果,為現(xiàn)階段人形機器人在運動控制、數(shù)據(jù)采集還有成本上的難題,都提供了更新的解題思路。 咱先來看第一篇論文,《 BeamDojo : Learning Agile Humanoid Locomotion on Sparse Footholds 》( BeamDojo :在稀疏立足點上學習敏捷類人運動)。 里面有倆地方還挺值得一嘮。 以前復(fù)雜地形的實驗,多是針對四足機器人的,那腳的形狀跟人形的壓根不一樣。即使有針對人形機器人的訓練,效率也不高,但 BeamDojo 劃重點就是 “ 人形機器人 ”“ 復(fù)雜地形 ”“ 高效 ” 。 另外一點,就是零樣本泛化這種舉一反三的能力。 所以 BeamDojo 強化學習框架,設(shè)計了一種專門針對人形機器人的訓練方法,讓機器人能在平衡木這些復(fù)雜地形上,走得又快又穩(wěn)。 就比如訓練過程中,研究人員引入了一個落腳點獎勵機制。 可以結(jié)合地形數(shù)據(jù)和機器人腳底的采樣,計算它踏出去的每一步,是否踩在安全區(qū)域內(nèi)。 如果大部分采樣點在安全區(qū)域內(nèi),自然有獎勵,反之就要挨罰。 另外,這篇論文的實驗中,還提到了從仿真環(huán)境到真實世界, BeamDojo 的零樣本泛化的成功率有 80% 。 換句話說,在仿真環(huán)境中訓練好之后,到了真實地形上,不需要額外的微調(diào),機器人也有很大概率能走得又快又穩(wěn)。 這種能力,對于機器人來說非常重要,所以也成為了現(xiàn)在學界和業(yè)界的主流研究方向。 像 AI 大牛李飛飛和她的研究團隊,之前就發(fā)布過一篇論文, “ 數(shù)字表親 ” 可以讓機器人零樣本泛化的成功率達到了 90% 。 另外一篇論文,介紹的其實是一個人形機器人遠程控制系統(tǒng)。 這跟上次斯坦福那個,也是遠程控制的 Aloha 機器人不太一樣。以前只是控制雙臂,但上海 AI 實驗室的 HOMIE ,可以控制機器人全身的自由移動。 實現(xiàn)的原理大概就是設(shè)計了一套外骨骼設(shè)備( 機械手臂、智能手套、腳踏板 ),讓研究人員可以通過這個 “ 駕駛艙 ” ,用全身控制機器人。 這套系統(tǒng)的強化學習框架中,也涉及到了三個核心技術(shù):上半身姿態(tài)課程學習、高度追蹤獎勵和對稱性利用。 專業(yè)名詞聽起來很嚇人,但概念理解起來也沒那么難。 像上半身姿態(tài)課程學習,就是讓機器人學習更多、更復(fù)雜的上肢動作。 而高度追蹤獎勵,跟訓狗一個道理。讓機器人下蹲或者站立到某個高度,完成任務(wù)就能獲得獎勵。對稱性利用,說白了就是讓機器人的左右兩邊的動作更協(xié)調(diào)、一致。 最主要的是,外骨骼設(shè)備的硬件成本,只需要 3500 ,人民幣。 這要比其他同樣是做遠程控制方案的機器人,成本要低得多。比如斯坦福 Aloha 機器人的硬件成本,就要 3.2 萬美元,在當時看來,已經(jīng)算比較低了。 所以這么一對比,更顯得 3500 元是擊穿地板價的存在。 而且從數(shù)據(jù)采集的精度來看,也要比 VR 設(shè)備的方案要更高( 論文中是跟 OpenTeleVision 進行了對比 )。 所以世超覺著, HOMIE 最大的貢獻之一,或許就是找到了一種低成本、高精度的機器人數(shù)據(jù)采集方法。 看下來,不管是 BEAMDOJO 強化學習框架,還是 HOMIE 控制系統(tǒng),這些前沿研究,都是沖著具身智能的疑難雜癥去的。 不可否認,現(xiàn)階段的具身智能還遠沒能達到,科幻電影中的完美對照。 但現(xiàn)在的機器人就特別像,十年前的 AI 。那個時候,也沒有人預(yù)想到 ChatGPT 、 DeepSeek 的出現(xiàn),什么 AI 視頻、 AI 音樂,更是天方夜譚。 因為大部分的技術(shù)探索,咱們平時也接觸不到,所以只有當質(zhì)變發(fā)生以后,我們才會反應(yīng)過來。
前兩天,宇樹科技的王興興不還說,預(yù)計年底他們家人形機器人 H1 的跑步速度,就要達到了 10m/s 。這速度,跟博爾特都有的一比。 反正,咱們就等著看吧。 本文來源:差評 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選