基于優(yōu)化并行的四足機(jī)器人運(yùn)動(dòng)技能學(xué)習(xí)
清華大學(xué)學(xué)報(bào)(自然科學(xué)版)
頁數(shù): 10 2024-05-28
摘要: 動(dòng)物對(duì)自然界的適應(yīng)能力是由環(huán)境選擇與適者生存決定的,四足哺乳動(dòng)物可以通過種群的進(jìn)化逐步適應(yīng)環(huán)境的變化,提高其對(duì)環(huán)境的適應(yīng)度和種群的生存率?;谏鲜鰡l(fā),該文在軟演員-評(píng)論家(SAC)算法基礎(chǔ)上提出一種基于優(yōu)化并行強(qiáng)化學(xué)習(xí)的算法OP-SAC,該算法使用進(jìn)化策略與強(qiáng)化學(xué)習(xí)交替訓(xùn)練,通過知識(shí)共享和知識(shí)繼承優(yōu)化四足機(jī)器人學(xué)習(xí)效果,提高訓(xùn)練效率。算法驗(yàn)證結(jié)果顯示,OP-SAC算法能夠完成...