1. Frozen Lake 환경 frozen lake 1.1. Q-learning decaying E-greedy 위에 코드를 실행하면 아래와 같은 결과를 얻을 수 있다. discount factor 는 0.99 이고 2000번의 episode 를 돌게 된다.noise 를 추가 하는 방법으로 exploration 을 Read more…
1. URDF 파일 생성 사진과 같이 이 위치에서 urdf 파일을 만들어준다. cartpole.urdf 파일을 복사해서 이름바꾸기를 이용하였다. 2. URDF 로봇 불러오기 먼저 isaacgym/python/examples 에서 joint_monkey.py 코드를 다음과 같이 수정한다. 위에서 보이는 AssetDesc(“urdf/custom.urdf”, False), 코드를 추가 함으로써 Read more…
강화학습에서 유명한 PPO 논문과 이론을 공부하고 -> gym 을 이용하여 2d 환경에서 실험해보고 -> 이 후 물리엔진이 포함된 3차원 환경의 webots 시뮬레이터를 이용해 실제로 로봇에 적용 해보겠습니다. 1. 이론 : Proximal Policy Optimization Algorithms 작성중.. Read more…
0 Comments