會自主學習的「家務機器人」來了,華人主創稱「它還比較蠢」

一個雙臂機器人站在灶台邊,用二指夾起碗邊,「啪」,把蝦仁往油鍋里一倒。機器人左手持鍋柄,右手操鍋鏟,翻炒起來。滋滋作響一陣後,機器人把蝦仁裝進一旁的盤子。這道煎蝦仁就算做完了。

有別於過往機器人的複雜訓練,這一機器人通過50次「遙操作」訓練,就學會了全自主煎蝦仁的技能。有科技博主解讀,該機器人學習能力極強,「通過模仿學習,直接克隆人類行為,這能讓它學會任意技能。」

這是斯坦福大學華人團隊研發的「家務機器人」mobile aloha。除了煎蝦仁以外,它還能夠疊被、洗衣、澆花、使用吸塵器、上下電梯與人類擊掌等等。當地時間1月4日上午,該團隊成員將演示視頻上傳後,很快在中外互聯網獲得了極大關注,有關話題獲得數百萬瀏覽量。「老人可以被機器人照顧了」「把人從家務中解放出來」「機器人才是解決智能家居的最後一公里」,網友們紛紛熱議。

據公開資料,該項目由兩名斯坦福博士生主導負責,斯坦福大學助理教授chelsea finn任指導老師。

「上傳項目資料是在美西時間早晨,中國在睡覺。過了十幾小時後,發現微信朋友圈也有人在轉。」1月10日,新京報記者聯繫到該項目科研團隊的中國成員符梓鵬,他是斯坦福大學計算機科學博士在讀生,主要研究ai及機器人領域。他介紹,mobile aloha是他與另外兩名團隊成員自主研發的一套操控系統,用以實現機器人全自動做家務。

符梓鵬解釋,團隊首次嘗試將「遙操作」、ai演算法「模仿學習」與「協同訓練」管道結合,使機器人的學習效率和效果被大大增強,並且能夠學會更多人類動作——首先,人類可以通過「遙操作」指揮機器人,即在一定距離外操作機器人的動作。比方說,人類做出倒蝦、炒蝦的動作,機器人跟著做。這樣的「跟做」是一種訓練,會產生相應的數據。而後,這些數據被ai演算法利用、分析,供機器人模仿。隨著「遙操作」訓練的次數增加,機器人會學會特定的人類動作,繼而能夠自主操作。

其團隊實驗數據表明,同一個人類動作經50次以上的「遙操作」訓練,機器人自主操作的成功率在90%以上。

「過去,人類可能需要寫幾萬行代碼來告訴機器人,走到哪裡要停下,看到了什麼,把什麼東西遞過來——有了『遙操作』提供足夠數據,再讓ai演算法加以分析利用,經過『協同訓練』,就可以得到一個能夠自主操作的機器人。即使不是計算機專業的普通人,也能夠進行『遙操作』,訓練機器人。」符梓鵬說。

據其團隊發布的資料顯示,這款機器人的製作成本約在3.2萬美元;且其軟體、硬體信息都已開源,有關數據被公布在團隊成員的github平台中。這意味著,依據免費的公開數據,任何個人和機構都可組裝並研究自己的同款機器人。

機器人在自主乘坐電梯。 受訪者供圖

機器人的時代是否就要到來了?就有關話題,我們與符梓鵬展開以下對話:

「眼下,機器人成功學習的都是簡單的、短的動作」

新京報:什麼時候開始這項研究的?有評論說,相比市面上的其他雙臂機器人,mobile aloha的成本便宜很多,你們是怎麼做到的?

符梓鵬:2023年暑假,我們就開始購買各種硬體。10月初,所有硬體到位後,我們開始組裝機器人,並研究改進演算法。

因為我們是自己買硬體組裝,買的底盤和機械臂都比較實惠,也沒有納入設計、組裝的成本,所以總成本並不高。

新京報:目前,機器人成功學會的人類動作有哪些?

符梓鵬:經過50次「遙操作」訓練後,機器人目前可以自主煎蝦、把鍋放到碗櫃里、使用垂直電梯。成功率在90%以上。

我們上傳的視頻中,機器人做的另外一些動作,比如敲雞蛋、完整地做一頓晚餐,並不是它自主完成的,而是我們「遙操作」進行的。因為這類動作比較複雜,訓練成本也太大,目前機器人還沒學會自主進行。

眼下,機器人成功學習的都是簡單的、短的動作。

新京報:有沒有可能通過更多次的「遙操作」訓練,把90%的成功率進一步提升?

符梓鵬:有可能,但會有邊際遞減效應。比方說,通過「遙操作」帶著機器人煎蝦,頭20次、30次訓練,能把機器人的自主操作成功率提高到70%;再訓練20次,也就是總共訓練50次,能把成功率提高到90%;再訓練下去,訓練到一千次、一萬次,也就是煎一千次、一萬次蝦,可能就只能把成功率提高到95%到98%。

所以說,進一步提高成功率這件事,需要商業界來做。我們團隊日常就兩三個人做事,經費和時間都有限,很難在這方面突破。

新京報:這項研究的主要難點與突破有哪些?

符梓鵬:首先是硬體方面的難點。現在,大部分有「遙操作」系統的機器人,要麼只能做簡單的抓取、放下的動作;要麼動作精細但不能移動,比如醫療機器人;要麼能移動,但可進行的操作有限,比方說掃地機器人。我們想要打造一台多功能的機器人,可以涉及家務、辦公室等場景的應用。但同時,又要控制成本。

另外是軟體方面有突破,此次我們把「遙操作」產生收集的數據和ai演算法結合,利用「協同訓練」管道,進一步提高了機器人的學習效率,這是此前沒有人嘗試過的。

符梓鵬在「遙操作」機器人。受訪者供圖

「對於這個項目,我們目前沒有任何商業化的打算」

新京報:為什麼選擇開源這個項目?

符梓鵬:我們希望更好地推廣這個項目,讓更多人參與進來,共同研究。對於這個項目,我們目前沒有任何商業化的打算。

新京報:你認為這款機器人目前可以投入生產、面向普通消費者嗎?

符梓鵬:對於研究者可以,但是對於普通消費者還不行。研究者可以購買它用以自己的有關研究,但消費者如果要使用它進行家務勞動的話,首先需要對它進行大量的「遙操作」訓練。比如說,你要它學會煎蝦,你就得帶著它煎五十次以上。這樣的訓練成本太大了。

要讓這款機器人進入普通人的家庭生活,得先簡化數據採集的過程。這在目前來說是一個技術瓶頸。

新京報:mobile aloha的未來研究與改良方向是什麼?

符梓鵬:首先是機器人的泛化能力。比方說,我教會它洗一個碗,它能不能夠以此類推,直接學會洗盤子。以目前的研究水平來看,想一步到位地達成這個目標,這是比較難的。我們設想的方法是,我們教它洗碗,也教它洗杯子、洗鍋具,洗儘可能多的不同的器皿。在這種情況下,它學會清洗一種從未見過的器皿的可能性會高很多。

也就是說,機器人做過的任務越多,它的泛化能力就越強。

另外,目前「遙操作」機器人,得有個人站在機器人後面。未來,我們希望實現通過視頻等遠程方式來「遙操作」機器人,這樣訓練起機器人來,會更方便。

通過「遙操作」,機器人正在學習為人類剃鬚。 受訪者供圖

「擁有一個全能型機器人,或許還需要很長的時間」

新京報:除了家務機器人以外,學界還在研究哪些應用領域的機器人?

符梓鵬:我所了解到的,還有醫療機器人、物流分揀機器人和生產線機器人等等。不同領域對於應用機器人的接受程度不一樣。比方說物流分揀機器人,它對安全性、精確性的要求沒有那麼高。但比方說醫療界,其實很難接受由全自動機器人完整地進行手術,它只能作為輔助,幫助外科醫生節省一定的手術時間。

新京報:機器人在未來能夠自主地幫人類做所有家務嗎?

符梓鵬:短期內很難。對於家務機器人來說,任務的變數太多了——不同款式的冰箱、不一樣高度的桌面、不同材質的地毯,都需要機器人進行不同程度上的學習。所以說,要做一個能幫人類干一切家務、全自主的家務機器人是很難的。

反之,目前發展得比較成熟的自主機器人是自動駕駛機器人。有研究表明,自動駕駛機器人的水平基本高於人類普通駕駛員。因為交通實際是很固定的一個場景,機器人的任務只有一個——從a到b,不要發生碰撞。不管在什麼地方開車,這個底層邏輯是一致的。機器人學習起來,就會相對容易。

新京報:你覺得在未來,機器人和人類的關係會是什麼樣的?

符梓鵬:其實現階段的機器人非常蠢,它們能幹的事情遠遠不如一個人類小孩來得多。它只能在某些領域,比方說開車,提高人類的效率。但你要說在方方面面,擁有一個通用的、全能型機器人,處理大部分事物的能力都比人類強的話,目前很難想像,或許還需要很長的時間來實現。

新京報記者 馮雨昕

編輯 陳曉舒

校對 王心