據介紹,該標準為具身智能領域構建了統一基準測試框架,規范了在仿真環境和真實環境下,開展具身智能基準測試的環境設置、任務庫構建、測試過程和指標計算方法。目前該標準已同步推進國際標準立項。
中國信通院有關專家表示,可信的評測體系是連接技術研究與大規模產業應用的橋梁和標尺,該標準將為行業提供統一的技術規范框架、建立互信基礎。在技術研發層面,為具身智能的能力評估提供統一的度量依據,指引技術迭代方向,幫助行業及早識別并收斂于高價值技術路線,減少研發資源的無效投入;在應用落地層面,為行業用戶開展產品選型與應用驗證提供標準規范支撐,避免市場出現“劣幣驅逐良幣”現象;在產業發展層面,將加速具身智能從實驗室走向真實場景,促進具身智能技術成果的工程化落地和產業化應用。
《YD/T 6770-2026 人工智能 關鍵基礎技術 具身智能基準測試方法》概述如圖1,描述了在仿真環境和真實環境下面向具身智能系統的基準測試框架、指標和方法,包括基準測試的環境設置、任務庫構建、測試過程和指標計算方法,適用于單個具身智能系統“感知-決策-執行”全鏈路能力的基準測試。
該標準構建了統一的具身智能基準測試框架(如圖2所示),包括環境設置、測試任務庫、測試過程和指標計算四部分。測試環境方面,規定了仿真測試環境和真實測試環境的構建要求,確保環境設置能反映現實環境的復雜性。測試任務方面,提出了測試任務庫構建方法和泛化評估基準,支撐評估被測對象在不同任務復雜性、不同能力維度上的性能表現和泛化性。測試過程方面,主要面向模型和部署模型的整機系統兩類測試對象開展測試,測試方法包括靜態仿真測試、動態仿真測試、真實環境測試和組合式測試等。測試指標方面,主要包括任務執行效率、任務成功率、人工干預率、場景擾動衰減率和平均任務能耗等五個指標。
該份行業標準的制定,對具身智能產業各方推動技術進步、產業應用和標準化建設具有重要意義。對研發側,為具身智能的能力評估提供了統一的度量依據,指引技術迭代方向,幫助行業及早識別并收斂于高價值技術路線,減少研發資源的無效投入。對應用側,為行業用戶開展產品選型與應用驗證提供標準規范支撐,避免市場出現“劣幣驅逐良幣”的現象。對產業側,加速具身智能從實驗室走向真實場景,促進具身智能技術成果的工程化落地和產業化應用。
下一步,中國信通院將將以具身智能標準實施為牽引,具身智能測試實驗室為保障,凝聚行業共識,解決實施難點,切實將標準化勢能轉化為推動具身智能產業高質量發展的動能。
來源 | 人民日報、CAICT人工智能






資訊頻道