[논문 리뷰][ROBOT RL][1] – PPO 구현, Proximal Policy Optimization, 강화학습, python, gym, gymnasium, Cartpole, Webots 시뮬레이터, inverted pendulum robot, 전체 코드
강화학습에서 유명한 PPO 논문과 이론을 공부하고 -> gym 을 이용하여 2d 환경에서 실험해보고 -> 이 후 물리엔진이 포함된 3차원 환경의 webots 시뮬레이터를 이용해 실제로 로봇에 적용 해보겠습니다. 1. 이론 : Proximal Policy Optimization Algorithms 작성중.. 저자: John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford, Oleg Klimov Abstract 환경과의 상호작용을 통해 Read more…