當前位置:首頁 > 實用文檔 > 鐵路運輸 > 正文

基于逆向強化學習的鐵路線路方案優(yōu)選研究

鐵道建筑 頁數: 7 2023-07-20
摘要: 鐵路線路方案評價及比選多采用組合賦權法,其主觀賦權過程計算冗雜。選取具備一定程度普適性的專家案例,采用最大熵逆向強化學習方法從專家案例中學習主觀賦權“知識”,得到專家案例隱藏的“獎勵”,從而獲取可解釋性的主觀權重。將此主觀權重與離差法所得客觀權重組合并投入后續(xù)TOPSIS(Technique for Order Preference by Similarity to Ideal...

開通會員,享受整站包年服務立即開通 >