[Robot RL][Gymnasium][1] 초보 – DQN 이론, python, OpenAi Gym, Frozen Lake, Q learning, Q network, Q table
1. Frozen Lake 환경 frozen lake 1.1. Q-learning decaying E-greedy 위에 코드를 실행하면 아래와 같은 결과를 얻을 수 있다. discount factor 는 0.99 이고 2000번의 episode 를 돌게 된다.noise 를 추가 하는 방법으로 exploration 을 하게 된다. noise e 는 episode 가 진행됨에 따라 감소한다. 점차 학습이 진행되면서 탐험을 줄이는 Read more…