當(dāng)前,全球科技競(jìng)爭(zhēng)已進(jìn)入戰(zhàn)略博弈期。以“具身智能”為代表的人工智能作為新一輪科技革命的重要驅(qū)動(dòng)力量,已然成為世界矚目的前沿陣地。掌握具身智能,就等于掌握了工業(yè)4.0時(shí)代的新質(zhì)生產(chǎn)力密碼。在這場(chǎng)關(guān)乎國(guó)運(yùn)的較量中,中國(guó)具身智能民營(yíng)企業(yè)智元機(jī)器人近期迎來一場(chǎng)重要檢閱。
4月29日,位于徐匯區(qū)的上!澳K倏臻g”大模型創(chuàng)新生態(tài)社區(qū)進(jìn)行了一次調(diào)研。智元機(jī)器人代表具身智能行業(yè)匯報(bào)進(jìn)展,并現(xiàn)場(chǎng)展示了智元靈犀X2、精靈G1、遠(yuǎn)征A2等機(jī)器人產(chǎn)品及相關(guān)場(chǎng)景算法,包含精靈G1清理桌面垃圾、靈犀X2騎自行車、以及汽車儀表盤裝配等生活和工業(yè)場(chǎng)景應(yīng)用。相關(guān)畫面登上央視新聞聯(lián)播后,引發(fā)了全國(guó)觀眾的關(guān)注與熱議。
為什么智元機(jī)器人能夠代表中國(guó)具身智能行業(yè)?
短短不到兩個(gè)月,智元機(jī)器人已三度參與了高層政企對(duì)話,持續(xù)獲得決策層的關(guān)注。
作為一家創(chuàng)立還不到兩年的具身智能企業(yè),智元機(jī)器人能夠從具身智能行業(yè)中脫穎而出并獲此殊榮,絕非偶然。目前諸多人形機(jī)器人在不停地嘗試走路、跑步、后空翻等 運(yùn)控能力,但這也意味著全球機(jī)器人產(chǎn)業(yè)正陷入"單科突進(jìn)"的技術(shù)困局——多數(shù)企業(yè)仍在單點(diǎn)能力上掙扎,核心痛點(diǎn)直指場(chǎng)景適配不足與量產(chǎn)化難題。
與一眾“偏科生”不同的是,智元機(jī)器人自創(chuàng)立伊始就錨定了一條差異化路線——以“AI+本體”的融合創(chuàng)新,協(xié)同發(fā)展機(jī)器人運(yùn)動(dòng)智能、交互智能、作業(yè)智能三大核心AI能力,打造世界級(jí)領(lǐng)先的通用具身機(jī)器人產(chǎn)品及應(yīng)用生態(tài)。簡(jiǎn)單來說,就是讓機(jī)器人在鋼鐵身軀的基礎(chǔ)上,還擁有聰明的大、小腦,變身“全能選手”。
為此,智元機(jī)器人構(gòu)建了領(lǐng)先的機(jī)器人“本體+AI”全棧技術(shù),完成了模型-數(shù)據(jù)-本體部署的全棧具身智能布局;诖耍窃獧C(jī)器人在全球范圍內(nèi)率先實(shí)現(xiàn)了人形機(jī)器人的規(guī);慨a(chǎn)和商業(yè)化落地,產(chǎn)品售往全球多個(gè)國(guó)家和地區(qū)。
此外,智元機(jī)器人成立了智元具身研究中心,專注于具身大小腦、空間智能、強(qiáng)化學(xué)習(xí)等方面的研究,面向軟硬件算法一體,全面覆蓋AI及機(jī)器人核心技術(shù),以問題驅(qū)動(dòng)科研,打造基礎(chǔ)科學(xué)研究、應(yīng)用科學(xué)研究、科研成果落地的有機(jī)閉環(huán)。

值得一提的是,智元機(jī)器人還致力于推動(dòng)具身智能行業(yè)創(chuàng)新與協(xié)同發(fā)展,成立以來相繼完成了機(jī)器人操作系統(tǒng)AimRT、靈犀X1全套圖紙及代碼、百萬真機(jī)數(shù)據(jù)集、海量仿真數(shù)據(jù)集和仿真評(píng)測(cè)工具的開源工作,助力構(gòu)建開放、協(xié)作的通用具身智能產(chǎn)業(yè)生態(tài)。
從運(yùn)動(dòng)智能到交互智能,讓機(jī)器人擁有更多情感互動(dòng)
當(dāng)前,具身智能機(jī)器人眾多企業(yè)仍處于“運(yùn)動(dòng)能力攻堅(jiān)期”,多數(shù)產(chǎn)品聚焦于雙足行走、跑步、跳躍等基礎(chǔ)運(yùn)動(dòng)控制,其核心能力多圍繞平衡性、關(guān)節(jié)靈活度及環(huán)境適應(yīng)性展開,尚未突破復(fù)雜操作與高階認(rèn)知的瓶頸。
例如,各地舉行的馬拉松運(yùn)動(dòng)會(huì)中,參賽機(jī)器人在足球、競(jìng)速等項(xiàng)目中頻現(xiàn)“被絆倒”“完賽率低”等問題,暴露出動(dòng)態(tài)場(chǎng)景下感知-決策-執(zhí)行的協(xié)同短板。

然而,以智元為代表的頭部具身智能企業(yè)正通過結(jié)合深度強(qiáng)化學(xué)習(xí)和模仿算法學(xué)習(xí)優(yōu)勢(shì),嘗試將機(jī)器人能力從“運(yùn)動(dòng)控制”推向“精細(xì)化任務(wù)執(zhí)行”階段,F(xiàn)在,精靈G1已經(jīng)可以進(jìn)行垃圾分類,靈犀X2能夠舉杠鈴、掌握騎自行車的動(dòng)態(tài)平衡、完成縫合葡萄的毫米級(jí)操作,遠(yuǎn)征A2則可以跳舞、打太極……智元三大家族產(chǎn)品均展現(xiàn)了從“機(jī)械重復(fù)”到“類人靈巧”的跨越。

過去幾十年,人形機(jī)器人領(lǐng)域更在乎的只是“動(dòng)起來”,冰冷的金屬關(guān)節(jié)和預(yù)設(shè)程序始終與“生命感”隔著一道鴻溝。當(dāng)春晚舞臺(tái)上的機(jī)器人扭起秧歌時(shí),人們驚嘆的是編排出的模式化動(dòng)作,而非情感共鳴。
如今,這場(chǎng)革命正轉(zhuǎn)向更本質(zhì)的命題:如何讓機(jī)器人的內(nèi)核“更像人”、“更懂人”,甚至能在對(duì)話中捕捉人類的微妙情緒?答案指向一個(gè)更具野心的目標(biāo)——讓機(jī)器不止于工具,而是成為能理解、回應(yīng)甚至承載情感的“類生命體”。

在交互方面,智元的機(jī)器人堪稱教科書級(jí)的范式。其中,靈犀X2搭載了基于VLM的多模態(tài)交互大模型“硅光動(dòng)語”,能夠?qū)崿F(xiàn)毫秒級(jí)的交互反應(yīng),通過人類的面部表情和語音語調(diào)精準(zhǔn)判斷情感狀態(tài),并做出相應(yīng)的回應(yīng)。
研發(fā)團(tuán)隊(duì)還將動(dòng)作模態(tài)集成到了模型當(dāng)中,賦予了靈犀x2更加鮮活的“生命力”,比如模仿人類的呼吸韻律、會(huì)“暗中觀察”,還有各類細(xì)小動(dòng)作和肢體語言,讓機(jī)器人擁有更多情緒表達(dá)的能力。

當(dāng)下正在如火如荼舉行的上海車展上,智元遠(yuǎn)征A2也成為了一道靚麗的科技風(fēng)景線,它與現(xiàn)場(chǎng)靚麗的車模共同迎接觀眾的到來。在展區(qū)前臺(tái),與遠(yuǎn)征A2互動(dòng)打卡的觀眾排起長(zhǎng)隊(duì),網(wǎng)友戲稱“銷售KPI已拉滿”。此外,遠(yuǎn)征A2還能與國(guó)際友人進(jìn)行英語交流,活脫脫是一個(gè)合格的“國(guó)際銷售”。

從智元機(jī)器人的交互表現(xiàn)來看,具身智能技術(shù)狂飆的終點(diǎn)并非替代人類,而是創(chuàng)造一種新的共生關(guān)系。當(dāng)機(jī)器人能讀懂嘆息中的疲憊、微笑中的欣慰,甚至對(duì)答如流時(shí),它模糊了工具與伴侶的界限,演化為解決老齡化、勞動(dòng)力短缺等發(fā)展困境的解題巧思。
作業(yè)智能:十八般武藝,機(jī)器人像人一樣“生活”
實(shí)驗(yàn)室模型在精心設(shè)計(jì)的桌面上能優(yōu)雅倒水,卻在真實(shí)廚房里打翻醬油瓶;仿真環(huán)境訓(xùn)練的抓取算法,遇到超市貨架上歪斜的薯片袋就瞬間失效。這種“仿真與現(xiàn)實(shí)”的割裂,本質(zhì)是行業(yè)對(duì)數(shù)據(jù)閉環(huán)與泛化能力的集體焦慮。
當(dāng)多數(shù)企業(yè)還在用合成數(shù)據(jù)“喂養(yǎng)”模型時(shí),智元機(jī)器人選擇了一條投入巨大但價(jià)值最高的道路:讓機(jī)器人在3000平方米的智元數(shù)采中心里,不斷完成“犯錯(cuò)-修正-進(jìn)化”的正循環(huán)。

智元數(shù)采中心作為全球首個(gè)投入運(yùn)營(yíng)的數(shù)采超級(jí)工廠,日均可采集數(shù)萬條數(shù)據(jù),構(gòu)建了家居、餐飲、工業(yè)、商超和辦公五大類型的真實(shí)場(chǎng)景,全面覆蓋機(jī)器人在生產(chǎn)、生活中的典型應(yīng)用需求,為機(jī)器人學(xué)習(xí)和具身智能大模型訓(xùn)練提供高質(zhì)量的數(shù)據(jù)養(yǎng)料。

基于海量的數(shù)據(jù)采集,去年年底,智元推出了世界上首個(gè)大規(guī)模高質(zhì)量機(jī)器人學(xué)習(xí)數(shù)據(jù)集AgiBot World,推動(dòng)人形機(jī)器人產(chǎn)業(yè)數(shù)據(jù)資源開發(fā)利用和開放共享,讓高質(zhì)量機(jī)器人數(shù)據(jù)在學(xué)術(shù)界與工業(yè)界都觸手可及。
今年3月,智元重磅發(fā)布首個(gè)通用具身基座模型——智元啟元大模型(GO-1),開創(chuàng)性地提出了Vision-Language-Latent-Action (ViLLA)架構(gòu),具有人類視頻學(xué)習(xí)、小樣本快速泛化、一腦多形、持續(xù)進(jìn)化等突出優(yōu)勢(shì)。進(jìn)一步打通了具身智能從仿真到實(shí)體應(yīng)用的閉環(huán),將具身智能推上了“通用化、開放化、智能化”的新臺(tái)階。
4月,智元機(jī)器人發(fā)布具身智能一站式開發(fā)平臺(tái)Genie Studio,推出“數(shù)據(jù)采集、模型訓(xùn)練,仿真評(píng)測(cè)、模型推理”四大核心模塊,徹底打通具身智能從數(shù)據(jù)到部署的完整鏈路,讓具身智能真正成為可編程、可迭代、可規(guī);男沦|(zhì)生產(chǎn)力。
當(dāng)全球具身智能開發(fā)者還在合成數(shù)據(jù)的"溫室"里蹣跚學(xué)步時(shí),智元機(jī)器人已構(gòu)建起具身世界的"數(shù)據(jù)雨林",月月出成績(jī),以行業(yè)內(nèi)見所未見的“智元速度”,讓機(jī)器人系統(tǒng)不斷掌握應(yīng)對(duì)復(fù)雜物理世界的"十八般武藝"——如果數(shù)據(jù)不再是稀缺資源,具身智能行業(yè)的"iPhone時(shí)刻"或許比想象中來得更快。
從實(shí)驗(yàn)室走出來,推動(dòng)人形機(jī)器人的商用化國(guó)際化
“智元速度”不只是產(chǎn)出數(shù)據(jù),也可以落地實(shí)體。2024年1月,智元機(jī)器人在上海建立全國(guó)首個(gè)量產(chǎn)規(guī)模的人形機(jī)器人制造工廠,具備核心零部件自研及整機(jī)集成、制造、測(cè)試能力、有自主可控、協(xié)同運(yùn)行的供應(yīng)鏈體系以及人工智能基礎(chǔ)軟硬件系統(tǒng)。僅僅1年時(shí)間,智元機(jī)器人就憑借領(lǐng)先的本體+AI全棧技術(shù),在全球范圍內(nèi)率先實(shí)現(xiàn)了第1000臺(tái)通用具身機(jī)器人量產(chǎn)下線,刷新行業(yè)紀(jì)錄。完成了從“實(shí)驗(yàn)室技術(shù)”向“商業(yè)化落地”的關(guān)鍵跨越,為全行業(yè)發(fā)展注入了強(qiáng)勁信心。

其中,智元的三大機(jī)器人家族——“全身高”人形機(jī)器人遠(yuǎn)征A2、“半身高”人形機(jī)器人靈犀X2、“輪式機(jī)器人”精靈G1,全方位覆蓋了人形機(jī)器人的應(yīng)用場(chǎng)景,滿足了各行各業(yè)的應(yīng)用需求。

此外,智元機(jī)器人也在積極開拓國(guó)際市場(chǎng)的合作布局。2025年2月,智元機(jī)器人宣布與哈薩克斯坦政府及投資機(jī)構(gòu)合作,推動(dòng)哈薩克斯坦的機(jī)器人生產(chǎn)的本地化,助力其建立機(jī)器人技術(shù)能力。4月2日,智元機(jī)器人宣布與國(guó)際頂尖具身智能公司Physical Intelligence(PI)達(dá)成合作,攻克長(zhǎng)周期復(fù)雜任務(wù)和跨場(chǎng)景應(yīng)用難題!目前,雙方合作已初見成效——一個(gè)通用模型可適應(yīng)不同指令,實(shí)現(xiàn)高效自主任務(wù)執(zhí)行,具身智能進(jìn)入快車道的未來可期。
奮勇向前,為中國(guó)智造裝上發(fā)展新引擎
站在第四次工業(yè)革命的黎明前夜,智元機(jī)器人作為中國(guó)具身智能的“先鋒”,正以“本體+AI”全棧自研的硬核實(shí)力和敢為人先的生態(tài)布局,為"中國(guó)智造"裝上發(fā)展新引擎。在這場(chǎng)沒有終點(diǎn)的科技馬拉松中,中國(guó)已在人工智能領(lǐng)域找到直線超車的支點(diǎn)。