[논문 리뷰][ROBOT RL][1] – PPO 구현, Proximal Policy Optimization, 강화학습, python, gym, gymnasium, Cartpole, Webots 시뮬레이터, inverted pendulum robot, 전체 코드
강화학습에서 유명한 PPO 논문과 이론을 공부하고 -> gym 을 이용하여 2d 환경에서 실험해보고 -> 이 후 물리엔진이 포함된 3차원 환경의 webots 시뮬레이터를 이용해 실제로 로봇에 적용 해보겠습니다. 1. 이론 : Proximal Policy Optimization Algorithms 작성중.. 저자: John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford, Oleg Klimov Abstract 환경과의 상호작용을 통해 Read more
![옵시디언 활용하기 [4] – 특별한 플러그인 추천, 인터페이스 꾸미기, 생산성 높이기, 멋지게. 9 image 68](https://i0.wp.com/openpj.co.kr/wp-content/uploads/2024/05/image-68.png?resize=360%2C240&ssl=1)

![Zotero 폼나게 활용하기 [1] - citation count 추가하기, impact factor 추가하기. "adding citation count, adding impact factor", 저널 순위 확인, 학회 순위 확인 93 image 6](https://i0.wp.com/openpj.co.kr/wp-content/uploads/2024/04/image-6.png?resize=286%2C117&ssl=1)
![[논문 리뷰] Reinforcement Learning for Robust Parameterized Locomotion Control of Bipedal Robots, 버클리 이족 보행 로봇, 강화학습 보행 제어, gymnasium, 시뮬레이션, python 110 cartpole PPO](https://i0.wp.com/openpj.co.kr/wp-content/uploads/2024/03/cartpole_PPO.gif?resize=360%2C240&ssl=1)