설악이
my devloping history.
- Seoul Korea
You may also enjoy
AI coding IDE
less than 1 minute read
codex OpenAI에서 제공하는 SDK openAI 페이지 curser 유료 버젼으로 plan/code/auto(agent)기능들이 있음. 커서 CodeGeeX (GLM-4.6) 중국에서 만든 저렴한 SDK (cursor보다 저렴함) z.ai cha...
초보자를 위한 강화학습 기본
less than 1 minute read
강화 학습이란 상황에 따라 보상을 최대로 하는 의사 결정을 하는 방법 강화학습의 요소 지도학습 : gpt, stable diffusion, copilot 등… 왜 강화 학습이 필요한걸까?? 사람이 생각하지 못하는 수에 대한 추론 Robot에서의 예.. ...
RTX5060TI + ISAACSIM
9 minute read
Isaac Sim을 활용한 4족보행 시뮬레이션 및 강화학습 가이드 1. 시스템 요구사항 및 환경 설정 1.1. 하드웨어 요구사항 Isaac Sim은 고사양 시뮬레이션 도구이므로, 원활한 작동을 위해 충분한 하드웨어 자원이 필요합니다. RTX 5060 Ti 그래픽 카드는 Isa...
로봇 강화 학습
3 minute read
robot reinforcement learning PPO(Proximal Policy Optimization) 강화 학습이란 모든 트로젝토리에서 리워드의 합이 최대가 되게 하는 방식을 찾아 내는것 policy gradient 샘플이 많아야 함. 많은 데이터가 필요한...