登入 直接訂購 教學視頻

智元推首個通用具身基座大模型GO-1

上海機械人初創公司智元機械人正式發布智元啟元大模型GenieOperator-1(GO-1),這是中國首個通用具身基座模型。

智元稱,這款模型具有泛化能力,能夠在極少數據甚至零樣本下泛化到新場景、新任務,降低具身模型的使用門檻,降低後訓練成本。

據介紹,該模型開創性地提出Vision-Language-Latent-Action(ViLLA)架構,實現可以利用人類視頻學習,完成小樣本快速泛化。ViLLA架構是由VLM(多模態大模型)+MoE(混合專家)組成,其中VLM借助海量互聯網圖文數據獲得通用場景感知和語言理解能力,MoE中的Latent Planner(隱式規劃器)借助大量跨本體和人類運算元據獲得通用的動作理解能力,MoE中的Action Expert(動作專家)借助百萬真機數據獲得精細的動作執行能力。在推理時,VLM、Latent Planner和Action Expert三者協同工作。目前智元啟元大模型已成功部署到智元多款機械人本體。

智元表示,通過ViLLA 創新性架構,智元機械人在5種不同複雜度任務上測試GO-1大模型,相比已有的最優模型,GO-1平均成功率提高了32%。其中在倒水、清理桌面和補充飲料務中表現突出。此外,GO-1大模型還可以搭配智元一整套數據回流系統,可以從實際執行遇到的問題數據中持續進化學習,「愈用愈聰明」。

股票及指數資料由天滙財經有限公司,泓滙財經資訊有限公司及財經智珠網有限公司提供。外滙及黃金報價由路透社提供。