cartpole PPO

[논문 리뷰] Reinforcement Learning for Robust Parameterized Locomotion Control of Bipedal Robots, 버클리 이족 보행 로봇, 강화학습 보행 제어, gymnasium, 시뮬레이션, python

이 논문은 이족 보행 로봇의 보행제어에 관한 논문인데요 이족 보행 로봇의 보행제어는 이족 보행 로봇이 가지는 높은 자유도, 비선형 동역학, 지면 충격 등이 정확하게 모델링 하기 어렵다는 문제를 가지고 있고 기존의 전통적인 model-based 방법들은 조심스러운 모델링 과정이 필요하고 대부분 환경 변화에 적응하기 힘들다는 문제가 있습니다. 이에 대해 저자는 다양한 동작 Read more…

Screenshot from 2024 03 08 20 55 35

[multi agent RL] [0][0] 초보, 시작하기 – 강화학습, ros2, humble, gazebo install, 가제보 설치

multi agent reinforcement learning 을 하려고 한다. 현재 시점에서 내 환경과 설치사항은 다음과 같다. ubuntu 환경은 새롭게 구성할 때가 많은데 이 때마다 위 항목들을 기본적으로 설치하고 공부를 시작하는 편이다. gazebo install $ sudo apt install ros-humble-gazebo-ros-pkgs ros2 sourcing $ source /opt/ros/humble/setup.bash check core tools install $ sudo apt install ros-humble-ros-core Read more…

[논문 리뷰][DreamWaQ][2] – 카이스트 사족 보행 로봇, 강화학습 보행 제어, gymnasium, 시뮬레이션, python

1편 – 논문 리뷰 [1][1] – DreamWaQ, 카이스트 사족 보행 로봇, 강화학습 보행 제어 실제 실험한 결과입니다. 제가 이족 보행 로봇을 연구하고 있기도 하고 다른 영역에서 적용 할 때 더 재미있는 결과를 볼 수 있을 것 같아 환경을 이렇게 구성하였습니다. 이 로봇은 4개 관절에 대한 torque 값을 action 으로 하고 Read more…

[논문 리뷰][DreamWaQ][3] – 논문 리뷰, 카이스트 사족 보행 로봇, 강화학습 보행 제어, 일부 구현

실제 실험한 결과. 다른 영역에서 적용 할 때 더 재미있는 결과를 볼 수 있을 것 같아 환경을 이렇게 구성하였습니다. 더 환경 구성하기 쉬워서. 이 로봇은 4개 관절에 대한 torque 값을 action 으로 하고 몸체의 위치 속도 각 관절에 대한 정보 그리고 다리가 땅에 닿았는지에 flag 그리고 10개의 lidar 가 observation Read more…

image 27

[논문 리뷰][DreamWaQ][1], 카이스트 사족 보행 로봇, 강화학습 보행 제어

오늘 발표할 논문은  DreamWaQ  라고 하여 사족보행 로봇 보행에 강화학습을 적용한 논문입니다. 이 DreamWaq 논문을 선택한 이유는 다음과 같습니다. -먼저 로봇을 연구하고 있는 입장에서 세계 사족보행 로봇 대회에서 1등을 한 로봇의 보행 기술이기 때문에 관심을 관심 을 가질 수 밖에 없었습니다. -현재 보드 게임이나 비디오 게임 이외에도 다양한 분야에서 강화학습 Read more…