硬核!“華為天才少年”讓自己組裝一臺家用機器人不是夢!
如果說宇樹機器人向我們展示了新一代機器人在工業(yè)、娛樂等方面的潛力,那么由“華為天才少年” 彭志輝創(chuàng)立的智元機器人則在昨天開啟了機器人在家用領(lǐng)域的應(yīng)用大門。
沒有跳舞、武術(shù)、翻越障礙等花哨的動作,智元機器人靈犀X2展示的僅僅只是騎車、縫葡萄、看書、聊天等我們?nèi)粘I钪?span id="zjvhxpf1b7" class="mgc">最普通的情形,但是我們知道,這些最普通的情形,才是機器人產(chǎn)業(yè)最大的難點——在電力的驅(qū)動下,想要化身大力士不難,只要一個千斤頂即可,但要模仿人類的日常動作,卻涉及人工智能、機械、電子、影像等方方面面的技術(shù)。
在擁有這些人類的基礎(chǔ)能力后,讓靈犀X2g更像一個人了!所以彭志輝表示:“我們希望機器人的生產(chǎn)力價值能夠外溢到日常生活,讓機器人成為‘吉祥三寶’,也就是保安、保姆和保潔?!?/p>
那么,智元機器人如何做到讓旗下產(chǎn)品初具家用機器人的雛形呢?
硬件為基:可以像組裝電腦一樣組裝機器人
總體來看,智元機器人靈犀X2全身共28個自由度、體重33.8千克,采用了一套基于Diffusion的生成式動作引擎,基于VLM的硅光動語多模態(tài)模型。其中,在硬件方面,靈犀X2共有三大創(chuàng)新!
像組裝電腦一樣組裝機器人:
靈犀 X2在硬件設(shè)計中,將靈犀 X2硬件系統(tǒng)抽象為一系列可復(fù)用的核心組件,核心組件包括:小腦控制控制器 Xyber-Edge,域控制器 Xyber-DCU,智能電源管理系統(tǒng) Xyber-MS 以及迭代了多版本的核心關(guān)節(jié)模組 Powerflow 等等。
通過這些可拆分、復(fù)用組件,智元能夠像組裝臺式電腦一樣,快速搭建起一套靈活、完整、可靠的人形機器人系統(tǒng)。
大量使用柔性材料:
在機體的材料選擇上,智元使用了非常親和的柔性材料。這使得靈犀 X2 的皮膚柔軟有彈性,這一方面能夠保證運動時的柔韌性,另一方面也對人類接觸友善。
全新的關(guān)節(jié)設(shè)計:
靈犀 X2 的機電關(guān)節(jié)模組重新設(shè)計,在 X2 原型機全身 28 個自由度中,沒有使用到任何一個并聯(lián)結(jié)構(gòu),既能夠保證慣量上移,又實現(xiàn)了傳動鏈的完全解構(gòu)。這意味著任一關(guān)節(jié)的活動,都是獨立驅(qū)動,避免并聯(lián)結(jié)構(gòu)中多鏈條驅(qū)動帶來的相互約束問題,降低了肢體末端的慣性,保證動作更靈敏精確。
軟件為“心”:讓機器人自身具有學習和交流能力
要讓一臺機器人像人,只有硬件創(chuàng)新是不夠的,這只能讓它在外形上像人。還必須搭配算法和大模型技術(shù),才能夠讓機器人在行為動作上,也像一個人!
相比于傳統(tǒng)的機器人,人類最大的特點是具有自主學習能力,而靈犀X2在這方面邁出了關(guān)鍵一步,該機器人同樣具有自主學習能力。
3月10日,智元機器人還發(fā)布了首個通用具身基座模型——智元啟元大模型,它開創(chuàng)性地提出了Vision-Language-Latent-Action (ViLLA) 架構(gòu),該架構(gòu)由VLM(多模態(tài)大模型)+ MoE(混合專家)組成,可以利用人類視頻學習,完成小樣本快速泛化,降低了具身智能門檻,并成功部署到智元多款機器人本體,持續(xù)進化。
目前,靈犀X2目前初步具備了簡單任務(wù)中對操作物體的零樣本泛化能力,比如給葡萄“縫合傷口”等精細活也不在話下。
當然,作為一款可能家用的機器人,靈犀X2還必須具有與人類交互的能力。
在人機交互方面,靈犀X2搭載多模態(tài)交互大模型“硅光動語”,并通過邊緣側(cè)“端到端”模型架構(gòu)的工程優(yōu)化,使其具備毫秒級的交互反應(yīng)能力,使其能夠通過人類的面部表情和語音語調(diào)精準判斷情感狀態(tài),并做出相應(yīng)的回應(yīng)。靈犀X2還能模擬人類的好奇心和注意力機制,有“偷看”“撓癢”等擬人化的表現(xiàn)。
彭志輝表示,硅光動語中的“光”代表視覺,“動”代表動作,“語”代表語音,因此也是第一臺真正具備復(fù)雜交互能力的“靈動機器人”。目前該公司還在完善這款機器人的思維模型。
在這些技術(shù)的加持下,在彭志輝發(fā)布的視頻中,彭志輝已經(jīng)能和靈犀X2展開正常聊天了。在問題和答案并未預(yù)設(shè)的前提下,機器人對彭志輝提出的問題一一作答,比如:
如果我的狗和你掉進水里,我先救誰?
如果給你看《銀翼殺手》你會不會哭到短路?
靈犀X2 回答的是「先救狗狗我沒事」,「不會哭但會感慨萬千」。這類語言表述自然,兼具「理性」與「感性」,甚至在回答的時候,它還會有手部動作向你互動。
相關(guān)閱讀
- 蘋果大中華區(qū)收入連續(xù)7個季度下滑 二季度或因供應(yīng)鏈調(diào)整錄得9億美元損失
- 突發(fā)!3000億芯片巨頭董事長辭職
- 津藥藥業(yè)一季度利潤穩(wěn)中有增:26個產(chǎn)品獲得國內(nèi)注冊批準 四個產(chǎn)品中標2024年第十批集采
- 中信金屬召開2024年年度暨2025第一季度業(yè)績說明會
- 新晨科技通過ITSS三級認證 數(shù)字化服務(wù)能力再獲權(quán)威認可
- 震驚!明微電子2024年歸母凈利潤709萬,低于董監(jiān)高薪酬之和
- 超卓航科2024年凈利潤1299萬:時任董秘王詩文薪酬46萬
- 匯宇制藥2024年凈利3.25億增長133%:時任董秘馬莉娜薪酬53萬
- 歐萊新材2024年凈利2817萬減少43%:董秘文雅薪酬60萬漲薪20萬
- 2025 年 Q1 定制家居行業(yè)財務(wù)剖析 我樂家居表現(xiàn)領(lǐng)跑行業(yè)
推薦閱讀
快訊 更多
- 04-10 11:21 | 為“首發(fā)經(jīng)濟”注入創(chuàng)新動力,CMEF見證寬騰醫(yī)學影像技術(shù)革新
- 02-20 18:53 | 手機也要上HBM芯片?三星計劃推出移動版HBM,預(yù)計首款產(chǎn)品2028年上市
- 12-30 16:40 | 國產(chǎn)首款DDR5內(nèi)存問世!價格戰(zhàn)開啟,復(fù)制長江存儲擊敗三星路徑!
- 12-30 16:36 | 華為手機回歸第一年:全年銷量或超4000萬臺 有望憑借Mate 70在高端市場擊敗蘋果
- 11-26 18:19 | 眾興菌業(yè)擬與漣水縣人民政府簽訂《招商引資合同書》 擬投資設(shè)立漣水食用菌產(chǎn)業(yè)園項目
- 11-26 18:16 | 美芝股份中選vivo全球AI研發(fā)中心-精裝工程采購項目(標段二)
- 11-26 18:14 | 健之佳擬用不超1億回購公司股份 維護公司價值及股東權(quán)益
- 11-26 09:53 | 格靈深瞳收購深圳市國科億道科技有限公司部分股權(quán)并增資5000萬
- 11-26 09:37 | 煒岡科技擬以1.49億購買衡所華威9.33%股權(quán) 華海誠科擬發(fā)行可轉(zhuǎn)債收購煒岡科技所持衡所華威股權(quán)
- 11-25 10:41 | 精工科技與眾億匯鑫簽署5.16億元銷售合同