智能清運服務(wù)機(jī)器人設(shè)計關(guān)鍵技術(shù)研究
機(jī)械設(shè)計
頁數(shù): 5 2024-10-20
摘要: 為解決老年人及行動不便人群的垃圾清運等問題,提出一種基于深度強(qiáng)化學(xué)習(xí)的智能清運服務(wù)機(jī)器人系統(tǒng)。建立了描述建筑環(huán)境和機(jī)器人狀態(tài)的馬爾可夫決策過程模型,包括樓宇結(jié)構(gòu)的描述、用戶需求的狀態(tài)空間、機(jī)器人可執(zhí)行的動作空間和多因素的獎勵函數(shù)的定義;采用深度Q網(wǎng)絡(luò)算法對模型進(jìn)行求解,通過神經(jīng)網(wǎng)絡(luò)近似動作價值函數(shù),采用經(jīng)驗回放和目標(biāo)網(wǎng)絡(luò)等技術(shù)提高模型訓(xùn)練的穩(wěn)定性;將訓(xùn)練好的模型策略應(yīng)用于清運服... (共5頁)