機(jī)場(chǎng)航班延誤恢復(fù)的強(qiáng)化學(xué)習(xí)算法
重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版)
頁(yè)數(shù): 9 2024-09-15
摘要: 機(jī)場(chǎng)出現(xiàn)航班延誤會(huì)導(dǎo)致飛行器和乘客滯留機(jī)場(chǎng),若航班延誤恢復(fù)調(diào)度不當(dāng)會(huì)擴(kuò)大延誤造成的損失。針對(duì)航班延誤恢復(fù)調(diào)度的損失最小化問(wèn)題,設(shè)計(jì)了延誤總損失計(jì)算的目標(biāo)函數(shù),構(gòu)建航班延誤恢復(fù)馬爾科夫決策過(guò)程,建立了機(jī)場(chǎng)航班延誤恢復(fù)重排班模型。為了解決計(jì)算的復(fù)雜性問(wèn)題,采用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)參數(shù)化策略函數(shù)對(duì)減小延誤損失目標(biāo)函數(shù)值的策略進(jìn)行參數(shù)化,利用獎(jiǎng)勵(lì)函數(shù)和優(yōu)勢(shì)函數(shù)對(duì)其進(jìn)行訓(xùn)練,提出了一種機(jī)場(chǎng)航...