[논문 리뷰][ROBOT RL][1] – PPO 구현, Proximal Policy Optimization, 강화학습, python, gym, gymnasium, Cartpole, Webots 시뮬레이터, inverted pendulum robot, 전체 코드

강화학습에서 유명한 PPO 논문과 이론을 공부하고 -> gym 을 이용하여 2d 환경에서 실험해보고 -> 이 후 물리엔진이 포함된 3차원 환경의 webots 시뮬레이터를 이용해 실제로 로봇에 적용 해보겠습니다. 1. 이론 : Proximal Policy Optimization Algorithms 작성중.. 저자: John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford, Oleg Klimov Abstract 환경과의 상호작용을 통해 Read more…

image 68

옵시디언 활용하기 [4] – 특별한 플러그인 추천, 인터페이스 꾸미기, 생산성 높이기, 멋지게.

1편 : 옵시디언 시작하기 [1] – 초보자를 위한 완벽한? 쉬운 가이드 2편 : 옵시디언 시작하기 [2] – 윈도우, 애플, 아이패드, 맥 동기화 : 중급자를 위한 완벽한? 쉬운 가이드 3편 : 옵시디언 활용하기 [1] – Excalidraw 비주얼 노트테이킹, 지식 관리 (feat. onenote, notion 이전) 4편 : 옵시디언 활용하기 [2] – 영단어 Read more…

[Robot RL][Isaac, IsaacGym][1] 초보 – anaconda 가상환경 설정, isaac gym 설치하기, 예제 돌려보기 {강화학습, reinforcement learning project, 시뮬레이터}

2.1. 우분투 설치 2.1.1 만약 우분투를 설치 했었다면.. 하드 디스크 파티션 만들기 및 포맷 에서 우분투가 설치되어있던 파티션 삭제 bootice 프로그램 프로그램에서 UEFI -> UEFI 부팅 항목 에 들어가면 ubuntu 항목이 있을 텐데 이를 삭제한다. 2.1.2. 부팅 usb 만들기 ubuntu 20.04 iso 파일을 다운받는다. rufus 프로그램을 킨다. GPT 로 해서 Read more…

[Robot RL][Isaac sim][1] 초보 – 프로그램 설치하기, 예제 돌려보기 {강화학습, reinforcement learning project, 시뮬레이터}

rtx4080, ubuntu 22.04.4 LTSnvidia driver = 535.171.04 1. 설치 구글에 검색해서 먼저 Omniverse 를 설치한다. 확장자가 AppImage 로 다운로드 되는데 터미널에서 파일을 다운받을 경로로 가서 위에 과정을 진행하면 omniverse 가 실행된 것을 볼 수 있다.로그인을 진행한다 exchange 메뉴에서 isaac sim install 진행한다. 2023.1.1 8.91GB 를 설치하였다. 이후 omniverse 에서 NUCLEUS Read more…

image 15

페이스북 Llama3 사용법 – 매우 쉬운 Llama3 window 사용법, 한국어 설정, chatGPT 대체, LM studio 설정, Ollama 모델 설치 및 삭제, vs GPT?

안녕하세요 여러분! 오늘은 ‘페이스북 llamma3’ 에 대한 이야기 입니다. 기존의 chatGPT 를 사서 쓰고 있었다면 그 가격에 아쉬움을 느끼시는 분들이 많으리라 생각합니다. 새로 나온 페이스북의 lamma3 가 chatGPT 를 대체 할 수 있을지 설치하여 사용해보겠습니다. 어렵지 않게 쉽게 할 수 있으니 같이 시작해보죠 1. Llama3 설치 및 간단한 실행 먼저 Read more…

image 6

Zotero 폼나게 활용하기 [1] – citation count 추가하기, impact factor 추가하기. “adding citation count, adding impact factor”, 저널 순위 확인, 학회 순위 확인

Many people use Zotero for managing academic papers because of its versatility and the range of pluins if offers. When you upload a paper to Zotero, it automatically provides the metadata for the paper. However, I’ve noticed some limitations with the current metadata provided. 1. Adding impact factor I refferred Read more…

cartpole PPO

[논문 리뷰] Reinforcement Learning for Robust Parameterized Locomotion Control of Bipedal Robots, 버클리 이족 보행 로봇, 강화학습 보행 제어, gymnasium, 시뮬레이션, python

이 논문은 이족 보행 로봇의 보행제어에 관한 논문인데요 이족 보행 로봇의 보행제어는 이족 보행 로봇이 가지는 높은 자유도, 비선형 동역학, 지면 충격 등이 정확하게 모델링 하기 어렵다는 문제를 가지고 있고 기존의 전통적인 model-based 방법들은 조심스러운 모델링 과정이 필요하고 대부분 환경 변화에 적응하기 힘들다는 문제가 있습니다. 이에 대해 저자는 다양한 동작 Read more…