考慮未來交互的端到端自動駕駛決策方法
- 作者:
- 點擊數:2394 發布時間:2026-05-10 12:33:38
- 分享到:
針對城市道路場景下端到端自動駕駛決策中前瞻性不足、復雜交互環境下安全性與通行效率難以兼顧等問題,本文提出了一種考慮未來交互的端到端強化學習決策方法:首先,將城市道路駕駛任務建模為馬爾可夫決策過程,并采用軟演員-評論家算法構建連續控制決策框架;其次,將鳥瞰語義分割圖、自車運動學信息、參考路徑點以及周圍車輛未來預測軌跡共同作為狀態輸入,提升模型對動態交通環境的時序理解能力;進一步地,在獎勵函數中引入基于預測結果的安全獎勵,引導智能體提前感知潛在風險并實施主動避碰,并針對多源異構輸入,設計多輸入特征提取與融合網絡,實現圖像信息與向量信息的聯合表征;最后,基于CARLA仿真平臺開展對比實驗與消融實驗。結果表明,本文所提軌跡預測引導軟演員-評論家模型在成功率、碰撞率、平均獎勵和平均速度等指標上均優于對比模型,能夠在復雜城市交通場景中實現更安全、更穩定且更高效的自動駕駛決策。