當前位置:首頁 > 科技文檔 > 數學 > 正文

基于距離信息的追逃策略:信念狀態(tài)連續(xù)隨機博弈

自動化學報 頁數: 13 2024-04-15
摘要: 追逃問題的研究在對抗、追蹤以及搜查等領域極具現實意義.借助連續(xù)隨機博弈與馬爾科夫決策過程(Markov decision process, MDP),研究使用測量距離求解多對一追逃問題的最優(yōu)策略.在此追逃問題中,追捕群體僅領導者可測量與逃逸者間的相對距離,而逃逸者具有全局視野.追逃策略求解被分為追博弈與馬爾科夫決策兩個過程.在求解追捕策略時,通過分割環(huán)境引入信念區(qū)域狀態(tài)以估計逃...

開通會員,享受整站包年服務立即開通 >