中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

具身智能帶火了數(shù)據(jù)采集生意

澎湃新聞?dòng)浾?喻琰
2026-05-06 14:17
來(lái)源:澎湃新聞
? 科創(chuàng)101 >
聽(tīng)全文
字號(hào)

“在具身智能尚未真正大規(guī)模商業(yè)化之前,數(shù)據(jù)作為基礎(chǔ)設(shè)施,會(huì)比終端應(yīng)用更早形成商業(yè)回報(bào)?!苯衲?月,覓蜂科技董事長(zhǎng)兼CEO姚卯青在智元合作伙伴大會(huì)上的發(fā)言,透露了具身智能數(shù)據(jù)這一新興賽道的底層邏輯:AI產(chǎn)業(yè)鏈里,賣“鏟子”的人往往先賺錢。

高盛此前預(yù)測(cè),到2035年,人形機(jī)器人市場(chǎng)規(guī)模可能達(dá)到380億美元。對(duì)機(jī)器人快速發(fā)展的預(yù)期,正在推高對(duì)上游訓(xùn)練數(shù)據(jù)的需求。Grand View Research的數(shù)據(jù)顯示,全球數(shù)據(jù)采集和標(biāo)注市場(chǎng)規(guī)模預(yù)計(jì)到2030年將達(dá)到171億美元。

為了讓人形機(jī)器人盡快實(shí)現(xiàn)“ChatGPT”智能涌現(xiàn)時(shí)刻,具身智能的數(shù)據(jù)生意正在升溫。

數(shù)據(jù)荒漠:十萬(wàn)年難題

具身智能數(shù)據(jù)的匱乏被行業(yè)戲稱“十萬(wàn)年難題”。大語(yǔ)言模型可以輕松從互聯(lián)網(wǎng)獲取海量語(yǔ)料,而機(jī)器人需要的是在真實(shí)世界中 “拿、放、走、抓、避障、操作”等三維動(dòng)作數(shù)據(jù),數(shù)據(jù)獲取的復(fù)雜程度和難度都比大語(yǔ)言模型高很多。

為了彌補(bǔ)數(shù)據(jù)缺口,目前具身智能的數(shù)據(jù)來(lái)源主要包含三類,并形成一座數(shù)據(jù)金字塔:位于頂層的是真機(jī)數(shù)據(jù),數(shù)據(jù)質(zhì)量最精準(zhǔn),成本也最貴,但卻是人形機(jī)器人落地的關(guān)鍵;仿真數(shù)據(jù)處于中層,成本低、可規(guī)模化,能夠彌補(bǔ)當(dāng)前真機(jī)數(shù)據(jù)的不足;互聯(lián)網(wǎng)視頻、人類行為數(shù)據(jù)處于金字塔底層,來(lái)源廣泛、泛化性強(qiáng)。

過(guò)去兩年,全國(guó)各地陸陸續(xù)續(xù)出現(xiàn)不同類型的“賣機(jī)器人數(shù)據(jù)”的公司。

以剛剛成立的覓蜂科技為例,公開信息顯示,覓蜂科技是智元機(jī)器人控股的具身智能數(shù)據(jù)平臺(tái)公司,姚卯青同時(shí)也是智元機(jī)器人的合伙人、高級(jí)副總裁。

早在覓蜂科技之前,智元就已經(jīng)自建數(shù)據(jù)采集工廠,通過(guò)真機(jī)遙操作等方式,在家居、餐飲、工業(yè)、商超和辦公等場(chǎng)景中采集機(jī)器人訓(xùn)練數(shù)據(jù)。姚卯青透露,智元更多關(guān)注機(jī)器人本體業(yè)務(wù),而面向B端市場(chǎng)的通用型數(shù)據(jù)服務(wù)業(yè)務(wù)未來(lái)將主要放在覓蜂科技。

目前市面上從事具身智能數(shù)據(jù)采集的公司主要分為以下三類:

一是真實(shí)場(chǎng)景數(shù)據(jù)采集,例如美國(guó)AI機(jī)器人初創(chuàng)公司 Sunday Robotics、國(guó)內(nèi)鹿明機(jī)器人采用的UMI(Universal Manipulation Interface:通用操作界面)。這條數(shù)采路線強(qiáng)調(diào)用手持夾爪和接口設(shè)計(jì),能實(shí)現(xiàn)便攜、低成本、豐富的數(shù)據(jù)采集,并且支持跨不同機(jī)器人平臺(tái)部署。

 二是試圖用仿真與合成數(shù)據(jù)構(gòu)建物理世界的數(shù)據(jù)生成引擎。比如創(chuàng)業(yè)公司光輪智能,專注仿真合成數(shù)據(jù)與“World-Behavior-Eval(世界-行為-評(píng)測(cè))”三層閉環(huán),把高精度仿真引擎、數(shù)據(jù)處理pipeline(管線)、評(píng)測(cè)基準(zhǔn)做成具身智能行業(yè)基礎(chǔ)設(shè)施;還有于4月17日正式登陸港交所、成為“全球空間智能第一股”的群核科技則利用在3D云設(shè)計(jì)領(lǐng)域積累的海量三維場(chǎng)景數(shù)據(jù),將業(yè)務(wù)觸角延伸至具身智能。

還有一類公司則嘗試走數(shù)據(jù)、本體+模型閉環(huán)路線,這是目前頭部具身智能公司普遍在探索的方向。比如,在2026年4月中旬剛獲得中國(guó)具身智能領(lǐng)域最大單筆融資金額的它石智航,同步研發(fā)機(jī)器人本體、具身大模型及穿戴式采集系統(tǒng)。

誰(shuí)在買數(shù)據(jù) 

從當(dāng)下的產(chǎn)業(yè)鏈位置來(lái)看,具身智能數(shù)據(jù)服務(wù)更像是一門“賣鏟子”的生意。誰(shuí)會(huì)購(gòu)買這些數(shù)據(jù)生意服務(wù)?

姚卯青在接受澎湃科技采訪時(shí)透露,目前數(shù)據(jù)需求方大致集中在大模型團(tuán)隊(duì)、海內(nèi)外大廠以及初創(chuàng)機(jī)器人公司。需求方普遍處于“你有多少我就買多少,什么時(shí)候有馬上要”的狂熱狀態(tài)。

另有一部分?jǐn)?shù)據(jù)需求方是傳統(tǒng)工業(yè)機(jī)器人。智域基石創(chuàng)始人楊哲軒告訴澎湃科技,一些在轉(zhuǎn)型中落后的傳統(tǒng)工業(yè)機(jī)器人廠商,也成為這波數(shù)據(jù)浪潮中的潛在買單者。智域基石成立于2025年12月,今年3月剛完成數(shù)千萬(wàn)天使輪融資,投資方包括靈初智能、穹徹智能、浙江人形、智平方等具身智能企業(yè),其核心任務(wù)是將雜亂的物理世界數(shù)據(jù)轉(zhuǎn)化為面向機(jī)器人任務(wù)成功率的高質(zhì)量訓(xùn)練輸入。

此外,還有產(chǎn)業(yè)下游的機(jī)器人訓(xùn)練場(chǎng)景方和地方政府。工廠、園區(qū)、商超等場(chǎng)景方手中的真實(shí)生產(chǎn)和服務(wù)數(shù)據(jù),本身就是有價(jià)值的數(shù)據(jù)資產(chǎn)。如果這些數(shù)據(jù)直接開放給上游模型公司,場(chǎng)景方可能在產(chǎn)業(yè)鏈議價(jià)中處于弱勢(shì)。楊哲軒稱,智域基石這樣的中游數(shù)據(jù)服務(wù)公司可以幫助場(chǎng)景方完成數(shù)據(jù)采集、清洗、對(duì)齊、治理和轉(zhuǎn)化,讓場(chǎng)景方的數(shù)據(jù)成為可被訓(xùn)練和交易的數(shù)據(jù)資產(chǎn)。

在具身智能數(shù)據(jù)定價(jià)方面,當(dāng)前市場(chǎng)上仿真數(shù)據(jù)與真實(shí)數(shù)據(jù)服務(wù)并存,行業(yè)仍處于早期階段,缺乏統(tǒng)一明晰的定價(jià)標(biāo)準(zhǔn)。

澎湃科技(m.nxos.com.cn)了解到,具身智能數(shù)據(jù)當(dāng)前總體定價(jià)區(qū)間在200至500元/小時(shí)。其中機(jī)器人在現(xiàn)實(shí)場(chǎng)景中實(shí)際操作采集的真機(jī)數(shù)據(jù),因最適合訓(xùn)練落地模型,需求最旺盛,價(jià)格也最貴,當(dāng)前國(guó)內(nèi)市場(chǎng)價(jià)格在 500元到1000元/小時(shí)。姚卯青透露,隨著產(chǎn)能逐步穩(wěn)定,不依賴特定機(jī)器人本體的無(wú)本體數(shù)據(jù)價(jià)格最終會(huì)收斂到真機(jī)數(shù)據(jù)的二分之一到三分之一左右。比如真機(jī)數(shù)據(jù)如果賣到每小時(shí)1000元,無(wú)本體數(shù)據(jù)未來(lái)可能穩(wěn)定在300元至400元。

數(shù)量不是唯一指標(biāo)

不過(guò),具身智能數(shù)據(jù)并不只是“多采一點(diǎn)”這么簡(jiǎn)單。

大語(yǔ)言模型的“GPT時(shí)刻”建立在相對(duì)清晰的Scaling Law之上,但在機(jī)器人領(lǐng)域,數(shù)據(jù)的Scaling Law缺乏同等清晰的定義,“數(shù)據(jù)是否越多就越好”本身就是一個(gè)難以驗(yàn)證的命題。

極佳視界是一家具身智能和通用機(jī)器人公司。該公司聯(lián)合創(chuàng)始人朱政稱,現(xiàn)在行業(yè)里使用的數(shù)據(jù)大多在實(shí)驗(yàn)室或人工場(chǎng)景采集,不夠真實(shí),缺乏泛服務(wù)、工業(yè)、家庭等真實(shí)場(chǎng)景數(shù)據(jù);另外,標(biāo)注也過(guò)于簡(jiǎn)略。多模態(tài)時(shí)代,一張圖可以有幾千字標(biāo)注,描述背景、前景和意圖,但現(xiàn)在很多視頻數(shù)據(jù)只有簡(jiǎn)單動(dòng)作標(biāo)注,環(huán)境和任務(wù)描述嚴(yán)重不足?!把a(bǔ)齊這兩點(diǎn),數(shù)據(jù)質(zhì)量才會(huì)真正提升?!敝煺f(shuō)。

它石智航相關(guān)工作人員告訴澎湃科技,具身智能數(shù)據(jù)生意的核心壁壘,不只是“采了多少小時(shí)”,而是數(shù)據(jù)是否足夠真實(shí)、干凈、可對(duì)齊,并且能否適配具體模型和本體。只看數(shù)據(jù)采集時(shí)間和數(shù)據(jù)量,不看效率,數(shù)據(jù)的純凈度,沒(méi)有任何意義。相比數(shù)據(jù)規(guī)模,數(shù)據(jù)的適配性、質(zhì)量和純凈度,以及噪聲水平,才決定這些數(shù)據(jù)能不能真正用于訓(xùn)練。

這也反映出具身智能數(shù)據(jù)生意的一個(gè)新問(wèn)題:數(shù)據(jù)量并不是唯一指標(biāo)。百萬(wàn)小時(shí)級(jí)數(shù)據(jù)如果不夠真實(shí)、不夠干凈,或者不能適配具體模型和本體,仍然難以直接轉(zhuǎn)化為機(jī)器人能力。

模型評(píng)價(jià)也是一個(gè)問(wèn)題。光輪智能CEO謝晨在智元合作伙伴大會(huì)圓桌論壇環(huán)節(jié)中明確表示,數(shù)據(jù)的核心問(wèn)題,不在數(shù)據(jù)本身,而是在模型評(píng)價(jià)上。現(xiàn)在缺乏一個(gè)足夠開放的、足夠真實(shí)的,且可規(guī)?;芈涞氐秸鎸?shí)場(chǎng)景的具身模型評(píng)價(jià)方式。如果沒(méi)有合適的評(píng)價(jià)體系,企業(yè)就不知道用什么樣的數(shù)據(jù)能夠做好具身模型。

在業(yè)內(nèi)人士看來(lái),未來(lái)兩類數(shù)據(jù)公司可能會(huì)有長(zhǎng)期增長(zhǎng)空間,一是成為行業(yè)標(biāo)準(zhǔn)平臺(tái),擁有具身智能生態(tài)必不可少的仿真、數(shù)據(jù)處理和數(shù)據(jù)評(píng)測(cè)工具;二是當(dāng)機(jī)器人進(jìn)入真實(shí)場(chǎng)景,持續(xù)產(chǎn)生大量新場(chǎng)景與長(zhǎng)尾任務(wù)后,需要長(zhǎng)期、高質(zhì)量的數(shù)據(jù)補(bǔ)充與迭代,具備跨廠商數(shù)據(jù)融合與提純能力的公司具有持續(xù)的商業(yè)價(jià)值。

    責(zé)任編輯:宦艷紅
    圖片編輯:樂(lè)浴峰
    校對(duì):劉威
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司