설악이
my devloping history.
- Seoul Korea
You may also enjoy
초보자를 위한 강화학습 기본
less than 1 minute read
강화 학습이란 상황에 따라 보상을 최대로 하는 의사 결정을 하는 방법 강화학습의 요소 지도학습 : gpt, stable diffusion, copilot 등… 왜 강화 학습이 필요한걸까?? 사람이 생각하지 못하는 수에 대한 추론 Robot에서의 예.. ...
RTX5060TI + ISAACSIM
9 minute read
Isaac Sim을 활용한 4족보행 시뮬레이션 및 강화학습 가이드 1. 시스템 요구사항 및 환경 설정 1.1. 하드웨어 요구사항 Isaac Sim은 고사양 시뮬레이션 도구이므로, 원활한 작동을 위해 충분한 하드웨어 자원이 필요합니다. RTX 5060 Ti 그래픽 카드는 Isa...
로봇 강화 학습
3 minute read
robot reinforcement learning PPO(Proximal Policy Optimization) 강화 학습이란 모든 트로젝토리에서 리워드의 합이 최대가 되게 하는 방식을 찾아 내는것 policy gradient 샘플이 많아야 함. 많은 데이터가 필요한...
SOTA?
less than 1 minute read
SOTA State-of-the-Art 최고 선능의 모델 SOTA 정리 page huggingface