復雜具身任務的長時序推理與分層決策方法綜述
- 點擊數:2502 發布時間:2026-02-10 13:24:06
- 分享到:
面向機器人操作與導航等復雜具身任務,長時序推理與分層決策需要兼顧語義規劃、技能復用與連續控制,并在稀疏回報與物理不確定性條件下保持閉環魯棒性。本文以任務層、技能層與控制層的分層視角為主線,系統綜述分層強化學習與技能先驗、潛在世界模型與序列建模,以及面向多模態觀測的表征學習與技能庫構建等經典路徑。在此基礎上,總結大語言模型在任務分解、技能調用與計劃修復中的作用,并梳理視覺、語言與動作基礎模型及擴散與流匹配策略在大規模數據驅動統一策略建模中的進展。最后,面向真實部署討論跨任務泛化、長期記憶與預測耦合、實時算力與安全對齊、評測與數據閉環等關鍵問題,并給出融合式系統架構的研究展望。