佐思汽研和水清木華研究中心聯合發布《2026年具身智能機器人數據產業布局研究報告》。
在具身智能的演進歷程中,高質量數據已被產業界和學術界公認為跨越通用精細操作鴻溝的核心要素,隨著硬件本體的逐步成熟,算法迭代的瓶頸在2026年將全面轉移至數據端。如何低成本、規模化地獲取具備物理真實性的多模態數據,成為了未來五年決定具身智能商業化落地的勝負手。
基于此,水清木華研究中心和佐思汽研發布《2026年具身智能機器人數據產業布局研究報告》,報告重點研究分析與梳理了國內24家具身智能數據企業在該領域的技術演進與商業布局,并系統性拆解當前具身智能數據賽道的核心趨勢、競爭格局與商業模式演進路徑。
中國增速領跑全球,穩居具身數據最大單一市場
歷經實驗室探索與商業化前夜的蟄伏,具身智能數據賽道在2025年正式迎來規模化落地的商業元年。全球市場總規模在2025年實現強勢突破達到2.42億美元,同比增長181.4%。2025-2030 年全球市場復合年增長率(CAGR)達 85.0%,2030年總規模將攀升至 52.5 億美元。
從宏觀發展曲線來看,整個市場呈現出顯著的指數級增長特征。這種爆發并非單一因素驅動,而是本體廠商、科研機構以及第三方數據供應商在底層基礎設施上形成共振的結果。進入商業化元年后,行業核心需求迅速從早期的遙操作實驗室搭建,向著標準化的海量訓練數據采購演變。
在全球具身數據產業的版圖中,中國市場的增長勢頭極為強勁。2025年,中國具身智能數據總規模達到5.0億元人民幣,同比增速高達203%,這一增長率超出了全球同期平均水平接近20個百分點。得益于國內龐大的制造業基本盤與豐富的商業落地場景,中國市場在全球市場中的占比穩定維持在約40%的高位。
從市場結構剖析,中國市場目前正處于數據采集硬件的快速鋪設期。現階段,國內市場的大量預算集中流向了動捕服、力反饋手套、無本體采集支架等數采硬件設備。數采設備與機器人在整體市場份額中占據絕對主導地位,純數據服務(DaaS)雖在快速萌芽,但目前多以定制化小批量標注與采集訂單為主,尚未形成占據統治地位的標準化交付體系。
盡管當前硬件銷售依然是核心的變現手段,但產業鏈的價值創造邏輯正發生根本性重構。隨著數據積累的規模效應顯現,單條數據的邊際成本將急劇下降,行業的護城河將從“硬件制造”向“數據資產運營”全面躍遷。
各大頭部企業正加緊構建專屬的數據工廠與聯合實訓場,試圖在未來的價值鏈再分配中搶占數據定價權,一場圍繞“高價值高質量數據集”的圈地運動已全面打響。
榜單十強梯隊分明,國家隊、本體廠與第三方獨角獸分庭抗禮
通過對數據規模產能、技術底座、數據集影響力、仿真能力及商業化落地等六大維度的量化評估,國內具身智能數據賽道的Top 10梯隊已呈現出清晰的陣營劃分。
位列前三的是光輪智能、國家地方共建人形機器人創新中心以及智元機器人,分別代表了獨立數據提供商、國家級公共平臺與全棧本體廠商三種截然不同的突圍路徑。國家隊依托政策與場景資源優勢強勢統籌標準,而獨角獸企業則憑借極致的技術垂直度在特定數據模態上建立高壁壘。
光輪智能作為該領域的獨角獸,其核心競爭力在于極強的數據生成效率與零邊際成本的規模化能力。該公司掌握全棧自研的物理仿真引擎,其2025年12月發布的EgoSuite第一人稱數據解決方案,目前已交付超30萬小時數據,且每周正在生產超2萬小時數據。在其跨本體數據映射與工業級評測基準(RoboFinals)的加持下,光輪智能不僅解決了Sim2Real的域差距痛點,更以極高的技術壁壘拿下了全球80%頂尖具身團隊的客戶份額。
智元機器人與優必選科技作為整機廠商的代表,選擇了“本體-數據-模型-場景”重度耦合的戰略閉環。智元在上海浦東斥資打造了4000平米超級數據工廠,部署近百臺遠征A2-D專機,實現單機單日千條數據的極速采集。
排在第六位的帕西尼感知科技,為行業提供了一個差異化的破局思路。在視覺與軌跡數據紅海競爭中,帕西尼以多維觸覺傳感為核心,打造了年產能近2億條的全模態具身數據產線。其Super EID Factory通過6D霍爾陣列式靈巧手與多視角視覺矩陣嚴格對齊,解決了工業精細裝配、3C制造等領域對“接觸力學”數據的需求。
排名榜單前列的無問智科、它石智航與簡智機器人等第三方服務商,無一例外地走向了生態結盟之路。它石智航以人為中心(Human-centric)的四模態數據采集,與庫帕思等場景方深度綁定;無問智科在長三角構建全域開放場景,聯合數十家產業鏈上下游機構。
物理仿真引擎構建核心護城河,光輪智能領跑全球合成數據與評測生態
以光輪智能為代表的中國廠商在全球仿真合成數據細分賽道中已占據超過一半的市場份額。光輪智能自身也迎來了收入的爆發期,2025年營收超億元,而2026年第一季度的收入已超越2025年全年。
光輪科技核心護城河體現在三個維度:
首先是底層引擎的高保真度與生成效率。光輪智能的仿真引擎能夠精準模擬軟體、流體、多體復雜接觸等物理特性,極大地彌合了Sim2Real(仿真到現實)的域差距。
其次,光輪智能構建了大規模的非本體數據引擎,覆蓋仿真合成數據與人類視頻數據(EgoSuite)兩大路徑,實現具身數據的規模化生產。其數據解決方案已在全球范圍內規模化交付,產能持續領跑行業。
最后是強大的平臺工程能力。其搭建的仿真評測平臺 RoboFinals平臺構建了100項高難度任務和場景,覆蓋家居、工廠、商超等真實應用環境,所有任務都源于真實需求,確保與真實世界對齊,支持規模化評測。Isaac Lab-Arena 面向機器人基礎模型的工業級規模化評測平臺,引入真實世界任務定義與評測標準,已被阿里通義千問等多家頂尖模型團隊用于內部評測。
最關鍵的是其在全球生態標準中的話語權。光輪智能不僅加入了國際權威的Newton TSC,參與制定SimReady數字資產標準,還推出了行業首個工業級評測基準RoboFinals。目前,全球80%的頂尖具身智能研發團隊(包括英偉達、谷歌、DeepMind等)都在使用其提供的數據集與平臺服務。
多源融合采集方案成大勢所趨,優勢互補重塑數據生產管線
遙操作(Teleoperation)作為當前獲取高質量真機數據的黃金準則,能夠完美保留人類在操作過程中的隱性決策與真實力覺反饋。然而,這種1:1的映射技術面臨著極其陡峭的成本曲線。以建設一個中等規模數采廠為例,動捕服、力反饋手套加上高自由度本體,單套硬件動輒數十萬元。經測算,傳統遙操作的單條有效數據成本高達8元以上,且單機日產能僅在千條左右。
與遙操作形成鮮明對比的是仿真合成技術的爆發。依托算力堆疊,仿真引擎能夠在虛擬環境中24小時不間斷生成包含極限工況的長尾數據,單條成本被極度壓縮至毫厘之間。
例如,銀河通用基于仿真平臺,一周內便可生成億級操作數據集。然而,看起來無限的仿真數據始終受制于Domain Gap(虛實鴻溝)。力學、接觸、摩擦等物理參數的簡化,使得純仿真模型直接遷移至物理世界時極易失真。因此,“90%仿真預訓練 + 10%真機微調”的融合范式成為當下的工程優解。
同時,為了平衡真實性與采集成本,以UMI(Universal Manipulation Interface)為代表的無本體/輕本體數據采集技術在2025年強勢崛起。鹿明機器人推出的FastUMI Pro手持式采集系統,將傳統激光基站替換為純視覺SLAM定位,不僅將單條采集時間從50秒壓縮至10秒,更將底層成本降至0.5元級別。更重要的是,UMI實現了數據與機器人硬件的徹底解耦,普通采集員在真實家庭或工廠即可完成毫米級精度的操作數據記錄,讓數據采集真正走出了實驗室。
伴隨大模型對數據需求維度的幾何級膨脹,單一技術路線已無法滿足“規模、成本、精度、泛化”的苛刻要求。行業全面邁向多源融合采集時代:以人類視頻注入通用物理常識,以仿真合成數據海量覆蓋長尾邊界,以UMI采集分布式擴充真實交互動作,最后依托高精度遙操作進行垂直場景的專家級微調。
數據流通模式向標準化與平臺化演進,數據超市與合規交易所加速演進
隨著具身智能從研發走向落地,行業獲取數據的方式正經歷一場深刻的商業模式重構。過去“一客一采、高度定制、周期漫長”的業務形態,正迅速向標準化、平臺化與DaaS化演進。
首先是“數據超市”模式的崛起。鹿明機器人是這一模式的先行者,2026年3月其推出了行業首個“FastUMI Pro數據超市”。鹿明沒有局限于接單定制,而是將工業制造、酒店服務、家庭生活等十大核心場景的具身數據,細分為數十個標準化操作任務,直接在官網商城上架銷售。用戶能夠像購買硬件標品一樣采購涵蓋視覺、位姿、力覺等多模態的數據集。
其次是“云端數據商城”模式的落地。帕西尼感知科技聯合騰訊云打造了具身智能“數據云商城”。該模式將龐大的多模態觸覺數據集與云端算力深度解綁。客戶無需自建本地算力服務器與存儲集群,直接在云端進行數據篩選、格式轉換與模型適配訓練。標準化數據包線上一鍵交付,徹底打通了“海量數據供給-云端算力調度-模型高效訓練”的閉環。
最為關鍵的是“數據交易所”打通了合規資產化的最后一公里。具身智能真實場景數據涉及復雜的知識產權、隱私脫敏及環境權屬問題。目前,江蘇省數據交易所、北京國際大數據交易所(北數所)等國家級樞紐已率先破局。例如,江蘇省數據交易所完成了全國首單具身智能數據集場內交易(江蘇箸境智能開發的2.5萬條四場景數據集);北數所則正式上架了帕西尼的OmniSharing DB全模態數據集。
來源:佐思汽車研究






資訊頻道