基于分布式強(qiáng)化學(xué)習(xí)的車輛控制算法研究
汽車工程
頁數(shù): 9 2023-09-25
摘要: 端到端自動(dòng)駕駛算法的開發(fā)現(xiàn)已成為當(dāng)前自動(dòng)駕駛技術(shù)研發(fā)的熱點(diǎn)。經(jīng)典的強(qiáng)化學(xué)習(xí)算法利用車輛狀態(tài)、環(huán)境反饋等信息訓(xùn)練車輛行駛,通過試錯(cuò)學(xué)習(xí)獲得最佳策略,實(shí)現(xiàn)了端到端的自動(dòng)駕駛算法開發(fā),但仍存在開發(fā)效率低下的問題。為解決虛擬仿真環(huán)境下訓(xùn)練強(qiáng)化學(xué)習(xí)算法的低效性和高復(fù)雜度問題,本文提出了一種異步分布式強(qiáng)化學(xué)習(xí)框架,并建立了進(jìn)程間和進(jìn)程內(nèi)的多智能體并行柔性動(dòng)作-評(píng)價(jià)(soft actor-c...