• <menu id="qseaa"><tt id="qseaa"></tt></menu><nav id="qseaa"><tt id="qseaa"></tt></nav>
    <optgroup id="qseaa"><tt id="qseaa"></tt></optgroup>
  • <object id="qseaa"><acronym id="qseaa"></acronym></object><input id="qseaa"></input>
    <menu id="qseaa"></menu>
  • <nav id="qseaa"><u id="qseaa"></u></nav>
  • <object id="qseaa"></object>
  • <input id="qseaa"></input><menu id="qseaa"></menu>
  • <s id="qseaa"></s>
  • <menu id="qseaa"><u id="qseaa"></u></menu>
  • <input id="qseaa"></input>
    ABB banner26年4月
    關注中國自動化產業發展的先行者!
    人工智能+制造融合創新研討會
    2026中國自動化產業年會
    2025工業安全大會
    OICT公益講堂
    當前位置:首頁 >> 資訊 >> 行業資訊

    資訊頻道

    具身智能的發展路徑:從本體智能、群體智能到網算協同智能
    • 點擊數:2773     發布時間:2026-02-10 13:02:43
    • 分享到:
    本文系統闡述了具身智能的概念、演進歷程、關鍵技術及應用前景。具身智能作為人工智能的前沿方向,其核心在于智能體通過物理實體(如機器人、智能駕駛汽車)與環境交互,實現自主決策與行為執行。具身智能的演進形成了兩條互補路徑: 一是聚焦個體能力的“本體智能”,它依賴多模態感知、運動控制算法及大模型任務規劃,被應用于工業制造、醫療手術與家庭服務;二是強調協作的“群體智能”,它通過通信協議、協調算法和分布式決策機制,實現多智能體協同作業,典型場景包括倉儲管理、災害救援與智能交通。為進一步支撐群體智能,本文認為“網算協同智能”有助于群體智能進行動態資源調度、任務卸載與分布式控制技術,可以解決資源沖突、提升系統彈性。針對硬件成本高昂、數據稀缺性與算法可靠性不足等未來挑戰,需通過跨學科融合、開源數據集建設與真實場景迭代來突破。具身智能有望在工業、醫療等復雜場景中規模化應用,成為推動社會進步的關鍵生產力。

    中國科學院沈陽自動化研究所 王宗宇,夏長清,李棟,曾鵬

    關鍵詞:具身智能;本體智能;群體智能;網算協同智能

    1  具身智能概述與發展歷程

    具身智能(Embodied AI)是人工智能領域的前沿方向,其核心在于智能體通過物理實體與環境交互,在持續學習與適應中實現自主決策與行為執行。與無實體的、以純軟件形式存在的“離身智能”相比,具身智能還具備物理實體,例如智能機器人、智能駕駛汽車等,擁有感知環境和與環境動態交互的能力[1],能夠直接參與生產實踐。

    具身智能的演進大致經歷了三個發展階段。第一階段是20世紀50至80年代,以第一臺工業機器人Unimate為代表,其智能僅限于預設程序,缺乏環境適應能力。20世紀80年代, Rodney Brooks開始直接關注通過感知和動作驅動的環境交互來設計智能機器。自此,行為主義AI開始發展,主張通過身體與環境的交互來產生智能[2]。第二階段是90年代至21世紀初,傳感器技術的進步使機器人開始具備感知能力,例如本田的ASIMO機器人能通過視覺傳感器識別障礙物,但智能仍局限于特定場景。在群體智能方面, 90年代誕生了蟻群優化算法、粒子群優化算法,為早期群體智能實現了軟件算法層面的突破。第三階段是2010年至今,互聯網和深度學習使機器人從“單個執行機器”升級為“與人交互協作智能體”[3]。2022年后大語言模型(Large Language Model,LLM)的突破性進展,為具身智能提供了強大的推理能力,使其能夠通過自然語言理解任務,并自主規劃行動路徑。為了推動具身智能從個體智能邁向群體協作,多智能體協作系統也日漸成熟,例如京東零售發布并開源的OxyGent多智能體協作框架,可實現智能體間的無縫協作、彈性擴展與全鏈路可追溯。

    具身智能被視為推動產業升級與科技競爭力提升的戰略核心技術,受到國內外各界的高度重視。 2023年,美國白宮更新《國家人工智能研發戰略計劃》(The National Artificial Intelligence R&D Strategic Plan),聚焦機器人、人工智能等具身智能體關鍵環節,重點關注人工智能交互和協作的新范式。 2025年“兩會”期間,具身智能首次被寫入政府工作報告,并作為未來產業的重要組成部分,標志著其正式進入國家戰略規劃,是“十五五”重點發展的未來產業。北京、浙江、廣東等地相繼出臺政策支持,計劃培育千億級產業集群,具身智能的產業化進程顯著加速。國務院發展研究中心相關研究報告認為,中國具身智能產業市場規模有望在2030年達到4000億元,2035年突破萬億元[4]。

    具身智能發展至今,大體形成了兩條路徑:面向個體能力的“本體智能”和面向協同演化的“群體智能”。本體智能關注單個智能體的能力,使用傳感器獲取環境信息,并通過內置的大模型理解任務并生成行為策略。群體智能則指多個具身智能體通過協作形成的集體智能體,主要包括通信、任務分配和協同決策,智能體之間通過信息共享和協調算法實現單體能力無法完成的復雜任務,例如無人機集群。發展本體智能和群體智能這兩條路線并非互斥,而是互相補充,共同推動具身智能的發展和應用。具身智能結構如圖1所示。

    圖片1.png

    圖1 具身智能結構

    2  本體智能的關鍵技術及應用場景

    本體智能是基于物理實體感知環境并執行行動的智能系統,是具身智能系統的基礎單元,主要應用于智能制造、自動服務等場景。其技術架構涵蓋多模態感知、精細運動控制、大模型決策等部分。本體智能結構如圖2所示。

    圖片2.png

    圖2 本體智能結構

    多模態感知技術是智能體理解環境的前提。具身智能體需模擬人類的視覺、觸覺、聽覺等感官功能,通過傳感器融合實現全面環境感知。視覺方面,高分辨率攝像頭與激光雷達用于物體識別與導航;觸覺方面,柔性觸覺傳感器能感知壓力、溫度與材質;聽覺方面,降噪麥克風陣列可識別語音指令與環境聲音。例如,清華大學研發的“紙質觸覺傳感器”將成本降至傳統傳感器的1/10,為大規模應用提供可能[5]。

    運動控制與驅動技術決定了智能體的物理行動能力。仿生關節需要模擬人類的多自由度運動,而柔順控制算法讓機器人與外界環境接觸的動作變得柔順,例如阻抗控制和導納控制。阻抗控制是控制機器人末端的動態關系,使其表現得像一個“彈簧-阻尼”系統。它接受位置指令,并根據實際位置與期望位置的偏差(即接觸力導致的形變),計算出需要輸出的力矩/力。導納控制的邏輯與阻抗控制相反,它首先通過力傳感器檢測到外部作用力,然后根據這個力偏差,計算出需要調整的位置或速度指令,再傳遞給底層的位置控制器執行。近年來為了讓機器人完成更多復雜的動作,宇樹科技、波士頓動力等前沿企業在這些經典控制算法的基礎上使用了強化學習、模型控制預測等算法,提高了具身智能的動態性能。

    大模型賦予智能體任務理解與規劃能力,使其能夠響應自然語言指令,例如,只需對機器人說“把桌上的蘋果遞給我”,它便能自動識別目標并規劃路徑。然而,現有利用視頻學習策略的工作都是基于圖像級別的視頻生成,這不僅計算成本高,而且生成結果較差。清華大學高陽研究組通過預訓練軌跡模型來預測視頻幀內任意點的未來軌跡,實現通過視頻為機器人提供演示,能自然地捕捉到物體空間移動的歸納偏差,并將物體運動與色彩和紋理分離開來,實現從人類到機械臂的跨具身一致性匹配。通過這些學習到的軌跡作為指導,機器人可以利用大規模無動作標簽的人類視頻演示中蘊含的先驗知識,實現小樣本動作標簽演示數據訓練魯棒的機器人操作策略[6]。

    在工業領域,優必選Walker S1機器人與比亞迪工廠的無人物流車協同作業,提升了生產效率;在醫療領域,手術輔助機器人通過觸覺反饋幫助醫生完成微血管縫合;在家庭服務中,養老陪護機器人可監測心率、檢測跌倒,并提醒服藥。此外,特種場景如核輻射巡檢、火災救援等,也逐步采用具身智能體替代人力。

    3  群體智能的協同機制與系統架構

    群體智能是相對于本體智能的概念,指多個具身智能體通過協作與信息共享形成的集體智能行為。有一些場景,例如倉儲管理、自動駕駛等領域需要具身智能體實現集群協同。為了實現這個需求,群體智能需要實現實時性、資源的合理分配、分布式決策,以完成超出個體能力的任務[7]。

    圖片3.png

    圖3 群體智能結構

    群體智能的技術基礎依賴于通信協議、協調算法與分布式決策機制。首先智能體間需建立低延遲、高可靠性的通信網絡,當前的技術前沿聚焦于構建標準化的通信協議,以實現不同來源、不同架構的智能體之間的無縫對話。例如, MCP為大模型提供了標準化調用外部工具(如數據庫、API)的能力;而A2A協議則致力于成為智能體之間的“通用語言”,其通過定義標準的任務描述、發現和結果返回格式,支持復雜得多智能體任務協作。5G等先進無線通信技術憑借其高帶寬、低時延和海量連接的特性,為以上協議的實現提供了基礎,使得群體智能的實時數據同步成為可能。

    協調算法如蟻群優化、粒子群優化等,被用于任務分配與路徑規劃,確保群體行為的一致性。蟻群算法模擬螞蟻通過信息素進行間接通信的機制。在路徑規劃、任務分配等優化問題中,智能體通過在解空間發送虛擬信息素,引導其他個體趨向更優解,最終自發尋找出高效路徑。粒子群優化算法受動物社會行為啟發。每個智能體被視為一個“粒子”,通過跟蹤自身歷史最優解和群體歷史最優解,動態調整自身的飛行速度和方向,從而使整個群體逐步收斂到問題的最優區域。

    分布式決策允許智能體在無中心節點的情況下通過局部交互達成全局目標。實現分布式決策的關鍵在于確保群體狀態一致的分布式共識算法(如RAFT算法的變體),在資源或任務目標沖突時,能夠高效協商出解決方案的沖突解決機制,以提升系統的魯棒性與高可用性。

    群體智能的典型應用包括工業自動化、災害救援與城市管理等。在工業場景中,優必選Walker S2機器人集群在極氪5G智慧工廠實現群體協同作業,共同完成物料搬運與裝配[8] ;在救災任務中,多機器人集群可覆蓋大面積區域,快速定位被困人員;在智能交通領域,車輛與路側設備通過車聯網通信優化交通流量,減少擁堵。這些應用顯示,群體智能能顯著提升任務效率與系統適應性。

    4  支持具身智能應用的資源調度技術

    群體智能的發展對資源的高效協同提出了前所未有的需求,尤其是在動態、實時的物理環境中。資源高效協同是群體智能發展的趨勢。實現群智協同的關鍵,正從單純的個體能力提升,轉向構建能使多智能體快速感知、靈活接入、協同決策與分布式控制的資源協同體系。圖4是其幾個關鍵的發展趨勢。

    圖片4.png

    圖4 群體智能的資源調度技術

    動態環境下的多源資源快速感知與自適應接入機制:通過接口自適配技術(如RESTful API/gRPC)和全域資源虛擬化映射模型,將地理上分散的、屬于云邊端的所有計算節點抽象成一個統一的“虛擬算力池”。群體智能的開發者無需關注底層資源的具體差異,只需要調用統一接口,即可根據應用需求靈活調動所需的網算資源。

    面向群體智能的分布式任務卸載與實時協同調度技術:面對復雜任務,需有機制能動態將其分解并分配給最合適的智能體。這涉及智能的任務路由、負載均衡和實時調度算法,確保任務高效執行,同時優化整體資源利用率和系統響應速度。例如,有研究提出通過實時監測各邊緣節點的資源利用率、網絡帶寬等指標,并據此動態調度任務,以應對負載變化。

    群體具身智能體的協同分布式控制技術:當智能體擁有物理身體(如機器人),協同控制至關重要。這要求突破多機協同控制技術,實現軌跡規劃、負載辨識與柔順控制等方面的協同。例如,在協同搬運大尺寸工件時,多個機器人需要動態調整姿態與力度,確保搬運過程的穩定性。這類似于自然界中蟻群通過局部交互完成復雜任務所展現的分布式決策與自適應特性。

    在未來應用場景中,資源調度技術將在具身智能生態中占據重要地位。例如,在汽車零部件柔性生產線場景下,生產管理系統收到一個新訂單,不會直接命令具體的自主移動機器人(Autonomous Mobile Robot, AMR),而是向網算調度軟件提交一個json格式的聲明式配置文件,表達類似于“需要在15分鐘內,將底盤組件從倉庫運至1號工位,并將發動機運至2號工位,隨后進行初步協同裝配。”的任務需求。隨后調度軟件的資源協同調度器開始工作,根據資源感知模塊提供的實時數據(哪些AMR空閑、電量如何、當前所處位置;邊緣服務器的GPU負載等),進行融合調度決策。

    其中一臺AMR在執行任務的途中發現路徑上被臨時堆放的物料阻塞后,通過運行在本地的大模型及時規避障礙,并將路徑變化信息和障礙點云上傳到云端和其他AMR共享,為其他AMR重新規劃行為策略。 AMR-1到達裝配生產線后,需要調用CV算法進行精密操作,向網算調度軟件提出申請虛擬化GPU資源,以實現更高級別的定位精度。與此同時通過TSN 5G網絡與聯網的機械臂在精確的時間窗內同步動作指令,避免碰撞或裝配錯誤。

    在這個場景中,網算調度軟件是群體智能的核心,而具身智能AMR是執行任務的終端。軟件將一群獨立的智能體真正融合成了一個協同合作的智能集群,解決了資源沖突問題,并自動分配算力和網絡,避免了爭搶。其通過全局感知和調度,保證了個體行為符合全局目標。通過彈性伸縮,可以輕松地向系統中加入更多AMR,軟件會自動集成和管理,實現了大規模群體智能。

    5  未來發展挑戰與展望

    具身智能的發展仍受制于硬件成本、數據稀缺與算法可靠性。例如靈巧手等精密部件的制造成本高昂,且大模型訓練所需真實數據獲取難度大,易獲取的仿真數據與真實世界有偏差。群體智能方面,動態環境中的信號干擾可能導致信息丟失或延遲,需要提高通信可靠性,并且網絡攻擊可能導致系統的安全與隱私存在隱患。此外,群體智能的“可解釋性”不足,其決策過程往往難以追溯,可能引發倫理問題。為解決這些問題,研究正聚焦于加密通信、粒子群算法等技術的集成,以在保障安全的前提下提升協作效率[9]。

    攻克具身智能的技術挑戰是一項系統工程,需要感知、控制、人工智能、網絡、材料等多學科的深度融合。在硬件方面,要通過產業鏈的整合升級與模塊化復用,降低具身智能硬件成本,同時要“軟硬件結合”,使用網算資源調度策略來提高算力硬件的利用率;在數據方面,要建設一批開源高質量數據集,完善我國AI領域數據集生態,打破企業之間的“數據孤島”,匯聚集體智慧;在算法方面,需要在真實場景中迭代,推動具身智能“走出實驗室”。未來應沿著強化個體智能與優化群體協同兩條主線并行推進,同時以資源調度等底層軟件技術為支撐,最終實現具身智能在工業、家庭、醫療等復雜場景中的規模化、成熟化應用,使其真正成為推動社會進步的關鍵生產力。

    作者簡介:

    王宗宇(2002-) ,男,碩士,現就讀于中國科學院沈陽自動化研究所,研究方向為工業互聯網、工業人工智能。

    夏長清(1985-),男,研究員,博士,現就職于中國科學院沈陽自動化研究所,研究方向為工業互聯網、工業人工智能。

    李   棟(1986-),男,研究員,博士,現任中國科學院沈陽自動化研究所工業控制網絡與系統研究室主任,研究方向為工業互聯網、工業人工智能。

    曾   鵬(1976-),男,研究員,博士,現任中國科學院沈陽自動化研究所副所長,研究方向為工業互聯網、工業人工智能。

    參考文獻:

    [1] Smith L, Gasser M. The development of embodied cognition: Six lessons from babies[J]. Artificial life, 2005, 11 (1 - 2) : 13 - 29.

    [2] 中國信息通信研究院. 具身智能發展研究報告[R]. 2024.

    [3] 趙曉光. 從機器人到具身智能: 人工智能的 “具身化”演進[J]. 北京人大, 2025, 26 (9) : 31 - 35.

    [4] 新華網. 具身智能冷思考[EB/OL]. 2026 - 01 - 05.

    [5] Qu J, Mao B, Li Z, et al. Recent progress in advanced tactile sensing technologies for soft grippers[J]. Advanced Functional Materials, 2023, 33 (41) : 2306249.

    [6] Wen C, Lin X, So J, et al. Any-point trajectory modeling for policy learning[J]. arXiv preprint arXiv: 2401.00025, 2023.

    [7] 龐樂. 群體智能算法的分析與應用[J]. 電子技術, 2024, 53 (09) : 36 - 37.

    [8] 程遠州. 人形機器人工廠協同實訓[N]. 人民日報, 2025 - 03 - 04 (02).

    [9] Priyadarshi R, Kumar R R. Evolution of swarm intelligence: a systematic review of particle swarm and ant colony optimization approaches in modern research[J]. Archives of Computational Methods in Engineering, 2025 : 1 - 42.

    摘自《自動化博覽》2026年第一期暨《2026具身智能專刊》

    熱點新聞

    推薦產品

    x
    • 在線反饋
    1.我有以下需求:



    2.詳細的需求:
    姓名:
    單位:
    電話:
    郵件:
  • <menu id="qseaa"><tt id="qseaa"></tt></menu><nav id="qseaa"><tt id="qseaa"></tt></nav>
    <optgroup id="qseaa"><tt id="qseaa"></tt></optgroup>
  • <object id="qseaa"><acronym id="qseaa"></acronym></object><input id="qseaa"></input>
    <menu id="qseaa"></menu>
  • <nav id="qseaa"><u id="qseaa"></u></nav>
  • <object id="qseaa"></object>
  • <input id="qseaa"></input><menu id="qseaa"></menu>
  • <s id="qseaa"></s>
  • <menu id="qseaa"><u id="qseaa"></u></menu>
  • <input id="qseaa"></input>
    啊灬啊灬啊灬快灬深用力试看