• <menu id="qseaa"><tt id="qseaa"></tt></menu><nav id="qseaa"><tt id="qseaa"></tt></nav>
    <optgroup id="qseaa"><tt id="qseaa"></tt></optgroup>
  • <object id="qseaa"><acronym id="qseaa"></acronym></object><input id="qseaa"></input>
    <menu id="qseaa"></menu>
  • <nav id="qseaa"><u id="qseaa"></u></nav>
  • <object id="qseaa"></object>
  • <input id="qseaa"></input><menu id="qseaa"></menu>
  • <s id="qseaa"></s>
  • <menu id="qseaa"><u id="qseaa"></u></menu>
  • <input id="qseaa"></input>
    ABB banner26年4月
    關注中國自動化產業發展的先行者!
    人工智能+制造融合創新研討會
    2026中國自動化產業年會
    2025工業安全大會
    OICT公益講堂
    當前位置:首頁 >> 資訊 >> 行業資訊

    資訊頻道

    Nature 最新論文:邊緣計算“任務卸載”新突破,時延降低 32.5% 的 MADRL 算法來了
    • 點擊數:2515     發布時間:2025-12-07 00:12:15
    • 分享到:
    算力下沉已成定局,但異構設備間的“協同”仍是痛點。Nature 旗下期刊最新研究提出了一種基于多智能體深度強化學習(MADRL)的動態卸載框架,通過“集中式訓練+分布式執行”的機制,為邊緣側的資源調度提供了一套數學上的最優解。

    摘要: 算力下沉已成定局,但異構設備間的“協同”仍是痛點。Nature 旗下期刊最新研究提出了一種基于多智能體深度強化學習(MADRL)的動態卸載框架,通過“集中式訓練+分布式執行”的機制,為邊緣側的資源調度提供了一套數學上的最優解。

    17660744161.png

    文 | 邊小緣

    近日,Nature 旗下綜合性期刊《Scientific Reports》刊發了一項關于邊緣計算(Edge Computing)的重要研究成果。

    針對超密集物聯網(Ultra-Dense IoT)場景下的資源爭搶問題,研究團隊提出了一種改進型的多智能體深度強化學習(MADRL)任務卸載框架。與傳統算法相比,該方案在非平穩環境(Non-stationary Environment)下的收斂速度提升了約 40%,并將系統平均端到端時延降低了 30%以上。

    在邊緣 AI(Edge AI)加速落地的 2025 年,這項研究從算法底層為“異構算力協同”提供了新的理論支撐。

    17660744361.png

    01. 核心痛點:當“貪婪算法”失效

    做邊緣計算調度的朋友都知道,經典的卸載策略(如貪婪算法、Lyapunov 優化)在面對海量并發時,往往顯得力不從心。

    核心難點在于環境的動態性與局部觀測的局限性:

    ·  狀態爆炸: 每一個新增的 IoT 設備都會指數級增加狀態空間(State Space)。

    ·  盲人摸象: 單個設備只能觀測到自己的信道質量和隊列長度,無法預知全局負載,極易導致“擁塞震蕩”——即所有設備同時卸載到同一個看似空閑的 MEC 節點,瞬間將其打爆。

    這篇論文的切入點,正是利用多智能體強化學習(MARL)來解決這個經典的“多用戶博弈”問題。

    02. 硬核拆解:基于 MADDPG 的改進架構

    為了解決上述問題,論文提出了一種基于MADDPG(Multi-Agent Deep Deterministic Policy Gradient)的改進算法。與其泛泛而談,不如直接看它的技術“干貨”:

    A. 建模:從單點到多維

    研究者將邊緣網絡建模為一個部分可觀測的馬爾可夫決策過程(POMDP)。

    17660744891.png

    B. 核心機制:CTDE(集中訓練,分布執行)

    這是該框架最大的亮點。

    ·  Critic 網絡(評判家): 部署在邊緣服務器側。它擁有“上帝視角”,能獲取所有 Agent 的狀態和動作,用于評估整體策略的好壞。

    ·  Actor 網絡(演員): 部署在每個 IoT 終端設備上。在推理階段,設備僅需根據本地觀測(Local Observation)即可做出毫秒級決策,無需與鄰居頻繁通信。

    這種CTDE 架構完美解決了“非平穩性”問題——即在訓練時考慮了對手的策略變化,但在執行時保持了去中心化的低通信開銷。

    C. 創新點:引入“注意力機制”

    為了防止 Critic 網絡在處理大規模 Agent 時輸入維度過高,論文還在 Critic 網絡中引入了注意力機制(Attention Mechanism)。系統會自動對“關鍵鄰居”賦予更高的權重,忽略對當前決策影響較小的遠端節點,從而顯著提升了算法在數百個節點規模下的訓練效率。

    03. 實驗數據:時延與能效的雙贏

    論文在 Python + TensorFlow 環境下,模擬了包含 5 個 MEC 服務器和 50-100 個異構 IoT 設備的城市場景。對比基準包括傳統的DQN(Deep Q-Network)、本地計算優先以及隨機卸載策略。

    關鍵數據表現:

    ·  時延降低: 在高負載場景(任務到達率  tasks/s)下,新框架的平均系統時延比 DQN 算法降低了32.5%。

    ·  能耗優化: 得益于更精準的功率控制,網絡整體能效(Energy Efficiency)提升了約18%,有效延長了電池供電型傳感器的壽命。

    ·  收斂穩定性: 引入注意力機制后,獎勵曲線的震蕩幅度明顯減小,達到穩定狀態的訓練步數(Episode)減少了約40%。

    04. 行業觀察與落地展望

    這對各種“算力盒子”和邊緣網關廠商意味著什么?

    第一,輕量化模型的部署將是關鍵。論文中的 Actor 網絡雖然輕量,但在嵌入式終端(如工業相機、AGV 小車)上運行推理仍需算力。未來,NPU(神經網絡處理單元)將成為邊緣終端的標配。

    第二,從“單兵作戰”到“蜂群思維”。未來的 MEC 系統,不再是由云端下發死板的規則,而是由成百上千個具備微型智能的終端自發組網。這種自組織(Self-Organization)能力,是實現 6G“萬物智聯”的前提。

    第三,場景適配。該算法特別適合車路協同(V2X)和無人機編隊場景。在這些場景中,拓撲結構變化極快,傳統的集中式調度來不及反應,而這種分布式的 MADRL 策略能做到即時響應。

    寫在最后

    學術界的算法突破,往往預示著 3-5 年后的工業界標準。

    這篇 Nature 子刊的論文,再次印證了AI + Edge的深度融合趨勢:未來的邊緣計算,拼的不僅是硬件的“硬肌肉”,更是調度算法的“軟實力”。

    我們將持續關注此類 MADRL 算法在真實工業現場的 POC 測試進展。

    參考材料:

    [1] Scientific Reports Article:https://www.nature.com/articles/s41598-025-25452-z[1]

    [2] Tesfay Z, et al. "Client-Master Multiagent Deep Reinforcement Learning for Task Offloading in Mobile Edge Computing", 2025.

    [3] 邊緣計算社區:深度強化學習在 MEC 中的應用綜述 (2024 版).


    來源:邊緣計算社區

    熱點新聞

    推薦產品

    x
    • 在線反饋
    1.我有以下需求:



    2.詳細的需求:
    姓名:
    單位:
    電話:
    郵件:
  • <menu id="qseaa"><tt id="qseaa"></tt></menu><nav id="qseaa"><tt id="qseaa"></tt></nav>
    <optgroup id="qseaa"><tt id="qseaa"></tt></optgroup>
  • <object id="qseaa"><acronym id="qseaa"></acronym></object><input id="qseaa"></input>
    <menu id="qseaa"></menu>
  • <nav id="qseaa"><u id="qseaa"></u></nav>
  • <object id="qseaa"></object>
  • <input id="qseaa"></input><menu id="qseaa"></menu>
  • <s id="qseaa"></s>
  • <menu id="qseaa"><u id="qseaa"></u></menu>
  • <input id="qseaa"></input>
    啊灬啊灬啊灬快灬深用力试看