REINFORCEMENT LEARNING

[Robot RL][Isaac, IsaacGym][1] 초보 – anaconda 가상환경 설정, isaac gym 설치하기, 예제 돌려보기 {강화학습, reinforcement learning project, 시뮬레이터}

2.1. 우분투 설치 2.1.1 만약 우분투를 설치 했었다면.. 하드 디스크 파티션 만들기 및 포맷 에서 우분투가 설치되어있던 파티션 삭제 bootice 프로그램 프로그램에서 UEFI -> UEFI 부팅 항목 에 들어가면 ubuntu 항목이 있을 텐데 이를 삭제한다. 2.1.2. 부팅 usb 만들기 ubuntu 20.04 iso 파일을 다운받는다. rufus 프로그램을 킨다. GPT 로 해서 Read more

By KANG, 2 yearsMay 2, 2024 ago

REINFORCEMENT LEARNING

[Robot RL][Isaac sim 2023][1] 초보 – 프로그램 설치하기, 예제 돌려보기 {강화학습, reinforcement learning project, 시뮬레이터}

rtx4080, ubuntu 22.04.4 LTSnvidia driver = 535.171.04 1. 설치 구글에 검색해서 먼저 Omniverse 를 설치한다. 확장자가 AppImage 로 다운로드 되는데 터미널에서 파일을 다운받을 경로로 가서 위에 과정을 진행하면 omniverse 가 실행된 것을 볼 수 있다.로그인을 진행한다 exchange 메뉴에서 isaac sim install 진행한다. 2023.1.1 8.91GB 를 설치하였다. 이후 omniverse 에서 NUCLEUS Read more

By KANG, 2 yearsMay 2, 2024 ago

REINFORCEMENT LEARNING

[Robot RL][1] 초보, 시작하기 – 강화학습, ros2, humble, gazebo tutorial, 가제보 예제, reinforcement learning project

현재 환경과 설치사항은 다음과 같다.

By KANG, 2 yearsMay 2, 2024 ago

REINFORCEMENT LEARNING

[논문 리뷰] Reinforcement Learning for Robust Parameterized Locomotion Control of Bipedal Robots, 버클리 이족 보행 로봇, 강화학습 보행 제어, gymnasium, 시뮬레이션, python

이 논문은 이족 보행 로봇의 보행제어에 관한 논문인데요 이족 보행 로봇의 보행제어는 이족 보행 로봇이 가지는 높은 자유도, 비선형 동역학, 지면 충격 등이 정확하게 모델링 하기 어렵다는 문제를 가지고 있고 기존의 전통적인 model-based 방법들은 조심스러운 모델링 과정이 필요하고 대부분 환경 변화에 적응하기 힘들다는 문제가 있습니다. 이에 대해 저자는 다양한 동작 Read more

By KANG, 2 yearsMarch 13, 2024 ago

REINFORCEMENT LEARNING

[multi agent RL] [0][0] 초보, 시작하기 – 강화학습, ros2, humble, gazebo install, 가제보 설치

multi agent reinforcement learning 을 하려고 한다. 현재 시점에서 내 환경과 설치사항은 다음과 같다. ubuntu 환경은 새롭게 구성할 때가 많은데 이 때마다 위 항목들을 기본적으로 설치하고 공부를 시작하는 편이다. gazebo install $ sudo apt install ros-humble-gazebo-ros-pkgs ros2 sourcing $ source /opt/ros/humble/setup.bash check core tools install $ sudo apt install ros-humble-ros-core Read more

By KANG, 2 yearsMarch 8, 2024 ago

REINFORCEMENT LEARNING

[논문 리뷰][DreamWaQ][2] – 카이스트 사족 보행 로봇, 강화학습 보행 제어, gymnasium, 시뮬레이션, python

1편 – 논문 리뷰 [1][1] – DreamWaQ, 카이스트 사족 보행 로봇, 강화학습 보행 제어 실제 실험한 결과입니다. 제가 이족 보행 로봇을 연구하고 있기도 하고 다른 영역에서 적용 할 때 더 재미있는 결과를 볼 수 있을 것 같아 환경을 이렇게 구성하였습니다. 이 로봇은 4개 관절에 대한 torque 값을 action 으로 하고 Read more

By KANG, 2 yearsFebruary 6, 2024 ago

REINFORCEMENT LEARNING

[논문 리뷰][DreamWaQ][3] – 논문 리뷰, 카이스트 사족 보행 로봇, 강화학습 보행 제어, 일부 구현

실제 실험한 결과. 다른 영역에서 적용 할 때 더 재미있는 결과를 볼 수 있을 것 같아 환경을 이렇게 구성하였습니다. 더 환경 구성하기 쉬워서. 이 로봇은 4개 관절에 대한 torque 값을 action 으로 하고 몸체의 위치 속도 각 관절에 대한 정보 그리고 다리가 땅에 닿았는지에 flag 그리고 10개의 lidar 가 observation Read more

By KANG, 2 yearsDecember 31, 2023 ago

REINFORCEMENT LEARNING

[논문 리뷰][DreamWaQ][1], 카이스트 사족 보행 로봇, 강화학습 보행 제어

오늘 발표할 논문은 DreamWaQ 라고 하여 사족보행 로봇 보행에 강화학습을 적용한 논문입니다. 이 DreamWaq 논문을 선택한 이유는 다음과 같습니다. -먼저 로봇을 연구하고 있는 입장에서 세계 사족보행 로봇 대회에서 1등을 한 로봇의 보행 기술이기 때문에 관심을 관심 을 가질 수 밖에 없었습니다. -현재 보드 게임이나 비디오 게임 이외에도 다양한 분야에서 강화학습 Read more

By KANG, 2 yearsDecember 21, 2023 ago

REINFORCEMENT LEARNING

Reinforcement learning: an introduction [1] Multi Armed Bandit

introduction basic structure key feature of reinforcement learning Review: Probaility and Random Variable Review: Poisson and Exponential Distribution Review: Independence, Correlation, Conditional Probability Uncorrelated 안에 independent 가 있다. x y p 0 0 0.25 1 1 0.25 1 1 0.25 2 0 0.25 Multi Armed Bandit Bandits (또는 Multi-Arm Bandits, Read more

By KANG, 2 yearsOctober 20, 2023 ago