訓(xùn)練泛化的人形機(jī)器人規(guī)劃、決策模型需要大量的標(biāo)注數(shù)據(jù),數(shù)據(jù)標(biāo)注是機(jī)器人訓(xùn)練過(guò)程中的關(guān)鍵步驟,涉及對(duì)機(jī)器人所需的各種數(shù)據(jù)進(jìn)行高質(zhì)量、高精度的特征識(shí)別和標(biāo)記,以提升大腦模型的泛化能力和人形機(jī)器人訓(xùn)練數(shù)據(jù)包括視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等多種模態(tài)數(shù)據(jù),數(shù)據(jù)標(biāo)注類(lèi)型包含圖像標(biāo)注、語(yǔ)音標(biāo)注、3D點(diǎn)云標(biāo)注和文本標(biāo)注等多種類(lèi)型,標(biāo)注內(nèi)容呈現(xiàn)出高度的專(zhuān)業(yè)性和復(fù)雜性。

當(dāng)前的數(shù)據(jù)標(biāo)注過(guò)程大多仍依賴于人工操作,存在工作效率低、難以拓展到多模態(tài)數(shù)據(jù)、難以適應(yīng)復(fù)雜任務(wù)需求等問(wèn)題,因此,研究一種多模態(tài)數(shù)據(jù)?動(dòng)化標(biāo)注解決方案具有重要理論和實(shí)際應(yīng)用價(jià)值。
東升國(guó)際(中國(guó))機(jī)器人有限公司官網(wǎng)、復(fù)旦大學(xué)、上海交通大學(xué)、同濟(jì)大學(xué)來(lái)數(shù)據(jù)集項(xiàng)目團(tuán)隊(duì),根據(jù)人形機(jī)器人數(shù)據(jù)集數(shù)據(jù)標(biāo)注相關(guān)標(biāo)準(zhǔn),利用主動(dòng)學(xué)習(xí)優(yōu)化智能感知算法模型,研制了針對(duì)操作任務(wù)的多模態(tài)數(shù)據(jù)的自動(dòng)化標(biāo)注算法。

項(xiàng)目組將操作任務(wù)數(shù)據(jù)的自動(dòng)化標(biāo)注過(guò)程分為操作者與環(huán)境標(biāo)注兩個(gè)模塊:
在自動(dòng)化標(biāo)注第一模塊中,針對(duì)復(fù)雜的靈巧操作手部姿態(tài)估計(jì)和跟蹤,項(xiàng)目組創(chuàng)新性地使用了空間基點(diǎn)集作為特征基,融合隨機(jī)多視角的觀測(cè),進(jìn)而通過(guò)點(diǎn)集注意力網(wǎng)絡(luò)輸出手部姿態(tài)控制點(diǎn),并以逆運(yùn)動(dòng)學(xué)重定向到同構(gòu)型雙臂靈巧機(jī)器人,完成相應(yīng)的操作任務(wù)。

在自動(dòng)化標(biāo)注第二模塊中,項(xiàng)目組提出了一種可泛化的物體姿態(tài)估計(jì)方法,通過(guò)引入具有幾何語(yǔ)義和特征語(yǔ)義的視覺(jué)表示,構(gòu)建基于特征相關(guān)性的迭代排序-優(yōu)化模塊,實(shí)現(xiàn)在推理階段對(duì)未知物體進(jìn)行準(zhǔn)確的6D姿態(tài)估計(jì)和跟蹤。

目前相關(guān)研究成果已融合至自動(dòng)化數(shù)據(jù)標(biāo)注工具:CR-MAA(CR Multi-modal annotations CR多模態(tài)標(biāo)注),能夠有效提升數(shù)據(jù)標(biāo)注效率和準(zhǔn)確性、降低標(biāo)注成本、優(yōu)化標(biāo)注流程和工作模式,通過(guò)主動(dòng)學(xué)習(xí)技術(shù)優(yōu)化得到的自動(dòng)化標(biāo)注算法模型也將為未來(lái)人形機(jī)器人數(shù)據(jù)集的拓展提供基礎(chǔ)支持,促進(jìn)人形機(jī)器人產(chǎn)業(yè)化進(jìn)程。
機(jī)器人東升國(guó)際聯(lián)合復(fù)旦大學(xué)、上海交通大學(xué)、同濟(jì)大學(xué)等高校已經(jīng)發(fā)布了多模態(tài)數(shù)據(jù)質(zhì)量評(píng)估與質(zhì)量增強(qiáng)解決方案、多模態(tài)人形機(jī)器人數(shù)據(jù)標(biāo)注智能感知技術(shù)解決方案,并對(duì)數(shù)據(jù)架構(gòu)與格式、標(biāo)注、治理與評(píng)價(jià)等數(shù)據(jù)集構(gòu)建的關(guān)鍵環(huán)節(jié)開(kāi)展標(biāo)準(zhǔn)化研究,為人形機(jī)器人大腦的打造賦能。