5月2 8日,記者從合肥市包河區(qū)獲悉,該區(qū)企業(yè)零次方推出了一款輪式人形機(jī)器人Zerith-H1,取意Home1。其搭載的垂直場(chǎng)景操作基礎(chǔ)模型Zerith-V0,為類家庭服務(wù)場(chǎng)景提供智能解決方案。
據(jù)介紹,家庭是通用機(jī)器人的終極服務(wù)場(chǎng)景,而在奔向家庭這個(gè)最復(fù)雜泛化、交互性最強(qiáng)的場(chǎng)景途中,該公司采取 “垂直場(chǎng)景切入 - 家庭場(chǎng)景延伸”的梯度推進(jìn)策略:優(yōu)先選擇與家庭場(chǎng)景高度相似的典型服務(wù)業(yè)垂直場(chǎng)景(如酒店臥室 / 衛(wèi)生間、餐廳后廚)作為突破口。
該公司相關(guān)負(fù)責(zé)人表示,在具身智能領(lǐng)域,同樣可通過(guò)定義清晰任務(wù)邊界(如酒店布草整理、餐廳餐桌處理),針對(duì)性突破一定范圍的物體泛化(各類家具 / 廚具)與背景適應(yīng)(不同光照、空間布局)的技術(shù)瓶頸,打造細(xì)分場(chǎng)景專業(yè)執(zhí)行者。
相較自動(dòng)駕駛的“零失敗容忍”特性,具身操作允許真實(shí)場(chǎng)景中一定程度上的試錯(cuò)操作,所積累的失敗數(shù)據(jù)集可以讓算法學(xué)會(huì)糾正錯(cuò)誤操作,形成“數(shù)據(jù)采集 - 模型迭代 - 場(chǎng)景驗(yàn)證”的閉環(huán)加速效應(yīng)。這種特性使機(jī)器人能夠更早進(jìn)入真實(shí)環(huán)境,在動(dòng)態(tài)交互中持續(xù)進(jìn)化決策邏輯。以類家庭服務(wù)垂直場(chǎng)景為切入點(diǎn),機(jī)器人得以逐步攻克復(fù)雜度遞增的場(chǎng)景,轉(zhuǎn)動(dòng)從場(chǎng)景數(shù)據(jù)到多樣性數(shù)據(jù)的往復(fù)性飛輪,在真實(shí)環(huán)境中逐步增強(qiáng)模型能力;也能更早跑入商業(yè)小閉環(huán)。
目前,主流機(jī)器人操作VLA模型采用“感知 - 動(dòng)作”直連架構(gòu),依賴堆砌海量數(shù)據(jù)訓(xùn)練提升適應(yīng)能力,缺少對(duì)操作原理的基礎(chǔ)認(rèn)知。而零次方提出的Zerith-V0——采用“認(rèn)知-行為”雙系統(tǒng)架構(gòu),以被操作物體為中心構(gòu)建空間表征,實(shí)現(xiàn)原理驅(qū)動(dòng)式的智能操作。
這款家庭服務(wù)機(jī)器人也可通過(guò)學(xué)習(xí)不斷提升服務(wù)能力。在學(xué)習(xí)操作知識(shí)數(shù)據(jù)上,零次方通過(guò)大規(guī)模的視頻動(dòng)作數(shù)據(jù)來(lái)構(gòu)建。對(duì)于行為數(shù)據(jù),構(gòu)建了基于下游場(chǎng)景的動(dòng)作基元數(shù)據(jù)集。
模型架構(gòu)層面上,零次方搭建了分層雙系統(tǒng)的架構(gòu)——認(rèn)知系統(tǒng)構(gòu)建對(duì)操作物體的物理屬性與功能語(yǔ)義的理解;行為系統(tǒng)則基于物體空間信息映射,實(shí)現(xiàn)運(yùn)動(dòng)基元的組合優(yōu)化。兩者通過(guò)以操作物體為中心的統(tǒng)一空間表征作為交互中間件,屏蔽背景噪聲,提升背景泛化能力,讓系統(tǒng)更專注于任務(wù)本身。
據(jù)悉,這款家庭服務(wù)機(jī)器人最早將于年內(nèi)上市。
(安徽商報(bào) 元新聞?dòng)浾?郜征 通訊員 李亞明)