Google正利用大模型訓練機器人,使其能夠完成更多任務
品玩 / 何渝婷編譯
2024-07-15 10:40

(取自DeepMind X)

根據《 The Verge 》報導,Google DeepMind 研究團隊近日正在嘗試利用 Gemini 大模型訓練機器人,讓他們完成更複雜的任務。

據悉,該團隊在最新發表的論文中指出,Gemini 1.5 Pro 的上下文窗口足以讓用戶可以更輕鬆地使用自然語言指令與 RT-2 機器人互動。

其工作原理是拍攝指定區域的影片導覽,讓機器人透過 Gemini 1.5 Pro 學習當前空間的現實環境;然後,機器人可以根據觀察到的情況,通過語言和圖像輸出來執行命令。

另外研究人員還發現,Gemini 1.5 Pro 能讓機器人計劃如何完成導航以外的指令。

本文為品玩授權刊登,原文標題為「谷歌正利用大模型訓練機器人,使其能夠完成更多任務