초보자를 위한 강화학습 기본
강화 학습이란 상황에 따라 보상을 최대로 하는 의사 결정을 하는 방법 강화학습의 요소 지도학습 : gpt, stable diffusion, copilot 등… 왜 강화 학습이 필요한걸까?? 사람이 생각하지 못하는 수에 대한 추론 Robot에서의 예.. ...
강화 학습이란 상황에 따라 보상을 최대로 하는 의사 결정을 하는 방법 강화학습의 요소 지도학습 : gpt, stable diffusion, copilot 등… 왜 강화 학습이 필요한걸까?? 사람이 생각하지 못하는 수에 대한 추론 Robot에서의 예.. ...
Isaac Sim을 활용한 4족보행 시뮬레이션 및 강화학습 가이드 1. 시스템 요구사항 및 환경 설정 1.1. 하드웨어 요구사항 Isaac Sim은 고사양 시뮬레이션 도구이므로, 원활한 작동을 위해 충분한 하드웨어 자원이 필요합니다. RTX 5060 Ti 그래픽 카드는 Isa...
robot reinforcement learning PPO(Proximal Policy Optimization) 강화 학습이란 모든 트로젝토리에서 리워드의 합이 최대가 되게 하는 방식을 찾아 내는것 policy gradient 샘플이 많아야 함. 많은 데이터가 필요한...
SOTA State-of-the-Art 최고 선능의 모델 SOTA 정리 page huggingface
바이브 코딩 1. 대중적 개발 툴 1. 커서 커서 ai. 커서 위키독스. 2. 클러드 코드 클러드 코드. 클러드 코드 사용법1. 클러드 코드 사용법2. 2. open llm model 사용 가능 솔루션. 1. continue + LLM continue. contin...