本發(fā)明涉及機(jī)器人控制,特別是涉及一種基于小腦強(qiáng)化學(xué)習(xí)的機(jī)器人運(yùn)動(dòng)控制方法及系統(tǒng)。、在機(jī)器人運(yùn)動(dòng)控制與自適應(yīng)學(xué)習(xí)領(lǐng)域,深度強(qiáng)化學(xué)習(xí)技術(shù)已成為解決復(fù)雜技能學(xué)習(xí)問題的主流范式。其中,無模型強(qiáng)化學(xué)習(xí)方法,如近端策略優(yōu)化算法,因其無需預(yù)先建立精確的環(huán)境動(dòng)力學(xué)模型,并能直接處理來自傳感器的高維狀態(tài)輸入...