四輪驅動破局落地瓶頸,智元構建具身智能 “飛輪體系”。
本文為IPO早知道原創(chuàng)
作者|Stone Jin
據(jù)IPO早知道消息,由智元機器人主辦,以“全球視角下的具身智能新機遇”為主題的“智啟具身論壇”于7月27日在上海世博展覽館舉行。
在本次論壇上,智元機器人合伙人&具身業(yè)務部總裁姚卯青以《通向具身智能大規(guī)模突破之路——智元的本體,數(shù)據(jù),算法飛輪》為主題分享。
據(jù)姚卯青介紹,智元打通了機器人本體、運動智能、交互智能、作業(yè)智能,實現(xiàn)“一體三智”全棧閉環(huán)發(fā)展,并構建“數(shù)據(jù)-模型-本體-場景”四輪驅動的具身智能飛輪體系。每一次"數(shù)據(jù)-模型-本體-場景"飛輪的轉動,都讓具身智能賦能千行百業(yè)更進一步。
目前,智元通過自建專業(yè)數(shù)采工廠,形成全球最大數(shù)據(jù)集AgiBot World并開源,姚卯青說:“面對具身智能數(shù)據(jù)的荒漠,我們選擇栽下第一棵樹,愿其能成為一片森林”;同時,智元還發(fā)布行業(yè)首個通用具身基座模型——啟元大模型,擁有“一腦多形”能力,可適配其他異構機器人本體,正如姚卯青所言:“當大模型賦予機器人智慧與靈魂,物理智能涌現(xiàn)的命運齒輪就開始轉動”。
此外,在場景端,智元機器人憑借“機器人+具身模型”技術重構了智能生產(chǎn)力范式,現(xiàn)已在工業(yè)制造、倉儲物流、電力巡檢、交互引導四大場景實現(xiàn)突破性落地。
“世界模型讓一部分機器人先想象起來,不是在夢中數(shù)電子羊,而是可以預見未來”。論壇上,姚卯青高度評價了世界模型的價值,并代表智元機器人發(fā)布了行業(yè)首個真正面向真實世界雙臂機器人的世界模型開源平臺“Genie Envisioner”(以下簡稱 GE)。該平臺融合了預測、控制、評測三大核心能力,為機器人從“看見”到“行動”提供了端到端、一體化的解決方案,讓機器人在數(shù)字時空里先彩排、再上崗。
GE平臺的核心,多視角視頻擴散模型GE-Base以AgiBot-World-Beta數(shù)據(jù)集為基礎,利用超過100萬條、近3000小時的頭部與雙臂腕同步視頻流,捕捉機器人操作任務中的空間布局、動作演化與語義意圖。160M參數(shù)級別的動作解碼器GE-Act,可以幫助機器人完成從視覺感知到機器人動作執(zhí)行的跨模態(tài)遷移。
從“固定軌跡”到“自主決策”,智元把柔性產(chǎn)線寫進機器人大腦。在真實平臺驗證中,搭載GE-Act的機器人先后完成“做三明治”“倒茶”“擦桌面”“使用微波爐加熱”“流水線裝箱”等五項任務,各項成功率均遠超行業(yè)平均值,展示了前所未有的精度與魯棒性。
Genie Envisioner的發(fā)布,標志著機器人從被動執(zhí)行向主動“想象—驗證—行動”的轉變。未來,將擴展更多傳感器模態(tài),支持全身移動與人機協(xié)作,持續(xù)推動智能制造與服務機器人的落地應用。
此外,姚卯青預告,精靈系列下一代機器人本體精靈 G2 即將發(fā)布,相較于上一代,G2在運動精度、場景適配性上全面升級,具備原生數(shù)采能力,可勝任工業(yè)、商業(yè)、家庭等多元場景,進一步拓寬具身智能的應用邊界。
本文來源:IPO早知道
來源:IPO早知道
重要提示:本文僅代表作者個人觀點,并不代表樂居財經(jīng)立場。 本文著作權,歸樂居財經(jīng)所有。未經(jīng)允許,任何單位或個人不得在任何公開傳播平臺上使用本文內容;經(jīng)允許進行轉載或引用時,請注明來源。聯(lián)系請發(fā)郵件至ljcj@leju.com,或點擊【聯(lián)系客服】
樂居財經(jīng)APP
?2017-2025 北京怡生樂居財經(jīng)文化傳媒有限公司 北京市朝陽區(qū)西大望路甲22號院1號樓1層101內3層S3-01房間756號 100016
京ICP備2021030296號-2京公網(wǎng)安備 11010502047973號