大翻車！斯坦福超火機械人自曝內幕，研究者救場還受傷了，網友：放心了

2024-01-06 12:50:46 娛樂頭條 5356℃

金磊豐色發自凹非寺

量子位 | 公眾號 qbitai

爆火的斯坦福全能家務機械人mobile aloha，大！翻！！車！！！

你以為它擦個紅酒輕而易舉，但實際上卻是這樣的：

全給你弄撒嘍，順帶碎個杯子……

你以為它能化身大廚嫻熟烹炒，結果給你上演一個炒鍋底：

mobile aloha的翻車大合集還不止這些。

例如剛才炒完蝦的鍋，哎呦喂，一不小心沒拿住：

即使小哥一個箭步衝上去也沒阻止「悲劇」的發生（好像還燙到手了）。

這畫面，真是像極了庄嫂摔碗……

昨天還在「神壇」上的mobile aloha，一夜之間便被曝出了這麼多「笨手笨腳」的樣子，也是引來不少網友的圍觀。

然而，這次即使面對翻車鐵證，網友們的畫風卻是一反常態：

它並不完美，不過很可愛。

總會有犯錯的餘地。

最重要的是：

放心了。（手動狗頭）

這到底是怎麼回事？

斯坦福團隊自曝「醜聞」

原來，這段機械人大翻車的視頻，就是由斯坦福mobile aloha的作者tony z. zhao發佈的。

並且他還直言不諱地說道：

機械人還沒有做好準備接管這個世界。

而這段翻車視頻，正是機械人完全在自主模式下所犯的。

用作者的話來形容，就是「最愚蠢的錯誤」。

畢竟除了剛才我們展示的幾個例子之外，mobile aloha甚至連鍋都放不進櫥櫃里：

炒完的蝦粘鍋倒不出來不說，連碗的位置也找不到：

拿支筆也沒法找對位置下手：

面對失敗合集，作者卻是打趣道：

這是我目前為止最喜歡的視頻了，（不過）當機械人在你面前犯錯的時候，你就不會覺得那麼有趣了。

確實，畢竟手都被燙了……

不過作者今天自曝這段視頻其實應該還有另外一個原因。

因為前兩天mobile aloha神級現場的視頻確實引來了不小的關注度，不過很多人誤以為這是它在自主模式下完成的。

但其實，mobile aloha採用的是混合模式，並非完全自主，作者也呼籲網友們在吃瓜的同時認真看下論文和代碼。

值得一提的是，作者還引用了2015年波士頓動力atlas人形機械人「翻車合集」並向它致敬。

或許這也正如英偉達科學家jim fan說的那樣：

一步一個腳印。

學習50次，成功率能到90%

就在這兩天，mobile aloha團隊連續放出三個爆火視頻，展示了該機械人敏捷靈巧的家務能力，看呆網友。

包括做滿漢全席（磕雞蛋、給雞肉翻面這種細活都信手拈來）：

套枕套鋪床單：

澆花、拖地板、開瓶蓋，甚至逗貓貓：

那叫一個人模人樣，上得廳堂下得廚房。

不過，大部分都是真人操控的，比如上面這些。

更直觀的可以看下面這個抽紙擦玻璃的動圖，背後直接站了個人類1:1示範：

不過，對於一些相對簡單的任務，例如這個單炒蝦仁：

還有刷鍋、將餐椅歸位、呼叫並乘坐電梯、擦桌子等等，只需真人少量示教，它就可以學會，然後脫離人類進行自主操作。

具體而言，作者介紹，上面這些簡單動作目前只需要學習50次就可以做到90%的成功率——

經測試，mobile aloha可以連續9次擦乾倒灑了的酒、連續呼叫5次電梯都不會出錯，能夠保持一定的穩定性。

除此之外，它還能抗干擾，在完成歸置鍋具到柜子之中時，實驗人員不停向它面前投擲雜物，都完全沒有影響它發揮：

在訓練期間根本看不見的椅子？它也能準確識別並完成歸位任務。

那麼，作者是如何僅通過50個演示就讓mobile aloha實現自主任務的呢？

最關鍵的是通過act或擴散策略進行模仿學習，然後和靜態操作數據一起對機械人系統進行聯合訓練。

有了這一聯合訓練方式，機械人的性能可以顯著提高，尤其是那種需要精確操作的任務。

最後，也再次為介紹一遍斯坦福大學的這個機械人成果：

它於今年3月底正式發佈，歷經了8個月的迭代和2個月的測試。

一共三位作者，其中兩位為斯坦福計算機科學專業的華人博士生（最後一位是導師）：

當時的這位機械人，就已經能夠利用工具完成各種精密細活了，只不過只能在固定的位置：

當然，背後也是真人遙控的。

而正如其名aloha全稱是「 ow-cost pen-source rdware system」，這款機械人主打的就是開源和低成本：

全部軟硬件設計包括代碼和數據都一併發佈，而搭建這一個系統「只」需3.2萬美元（約合22.7萬人民幣），具體需要哪些硬件，作者還列了個清單，感興趣的朋友可以照着diy。

機械人元年？

幾乎和斯坦福的爆火機械人同一時間，谷歌也發佈了自家最新的研究成果，並且是一氣發了仨：

一個是將機械人決策速度提高14%，同時保持操作準確率不變並增加了10.6%的改進模型；

一個是專攻泛化能力的新框架，用了一種全新方法讓機械人完成從未見過任務的成功率從29%提升至63%；

以及一個可以同時容納20個機械人的收據收集系統，將用於加快機械人理解人類指令的能力的訓練。

這些新成果全部用於升級谷歌的機械人大模型rt-2。

和斯坦福的mobile aloha對比起來，谷歌的rt-2表現還是高冷一些，但它所有效果都是全自主的。

除了這兩家，李飛飛團隊也一直在跟進，其名為voxposer的機械人系統也已經可以聽懂人話完成各種指令，並且無需額外訓練。

這不由地讓人想到，不少人那句「2024會是機械人元年」的預言：

你覺得會成真嗎？

參考鏈接：

https://twitter.com/tonyzzhao/s

標籤：娛樂頭條

上一篇：突傳訃告！她於凌晨2點27分去世

下一篇：她突然宣布：和孫燕姿斷絕關係！