基于分布式深度強(qiáng)化學(xué)習(xí)的六足機(jī)器人步態(tài)學(xué)習(xí)與控制
組合機(jī)床與自動(dòng)化加工技術(shù)
頁(yè)數(shù): 5 2024-08-16
摘要: 針對(duì)六足機(jī)器人系統(tǒng)結(jié)構(gòu)與決策的復(fù)雜導(dǎo)致步態(tài)規(guī)劃與控制困難的問(wèn)題,提出了一種基于分布式強(qiáng)化學(xué)習(xí)的六足機(jī)器人步態(tài)學(xué)習(xí)與控制框架。該框架采用大規(guī)模并行學(xué)習(xí)的方式獲取訓(xùn)練數(shù)據(jù),通過(guò)強(qiáng)化學(xué)習(xí)的方法對(duì)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)驅(qū)動(dòng)訓(xùn)練,得到最優(yōu)控制策略,并在IsaacGym平臺(tái)下構(gòu)建仿真環(huán)境評(píng)估和驗(yàn)證六足機(jī)器人步態(tài)學(xué)習(xí)與控制的性能。結(jié)果表明,訓(xùn)練的六足機(jī)器人步態(tài)在獎(jiǎng)勵(lì)值、速度跟蹤和穩(wěn)定性都有良好的表現(xiàn),...