Isaac Sim을 활용한 4족보행 시뮬레이션 및 강화학습 가이드
1. 시스템 요구사항 및 환경 설정
1.1. 하드웨어 요구사항
Isaac Sim은 고사양 시뮬레이션 도구이므로, 원활한 작동을 위해 충분한 하드웨어 자원이 필요합니다. RTX 5060 Ti 그래픽 카드는 Isa...
robot reinforcement learning
PPO(Proximal Policy Optimization)
강화 학습이란 모든 트로젝토리에서 리워드의 합이 최대가 되게 하는 방식을 찾아 내는것
policy gradient
샘플이 많아야 함.
많은 데이터가 필요한...