Recent posts

초보자를 위한 강화학습 기본

less than 1 minute read

강화 학습이란 상황에 따라 보상을 최대로 하는 의사 결정을 하는 방법 강화학습의 요소 지도학습 : gpt, stable diffusion, copilot 등… 왜 강화 학습이 필요한걸까?? 사람이 생각하지 못하는 수에 대한 추론 Robot에서의 예.. ...

RTX5060TI + ISAACSIM

9 minute read

Isaac Sim을 활용한 4족보행 시뮬레이션 및 강화학습 가이드 1. 시스템 요구사항 및 환경 설정 1.1. 하드웨어 요구사항 Isaac Sim은 고사양 시뮬레이션 도구이므로, 원활한 작동을 위해 충분한 하드웨어 자원이 필요합니다. RTX 5060 Ti 그래픽 카드는 Isa...

로봇 강화 학습

3 minute read

robot reinforcement learning PPO(Proximal Policy Optimization) 강화 학습이란 모든 트로젝토리에서 리워드의 합이 최대가 되게 하는 방식을 찾아 내는것 policy gradient 샘플이 많아야 함. 많은 데이터가 필요한...

SOTA?

less than 1 minute read

SOTA State-of-the-Art 최고 선능의 모델 SOTA 정리 page huggingface

바이브 코딩 툴

less than 1 minute read

바이브 코딩 1. 대중적 개발 툴 1. 커서 커서 ai. 커서 위키독스. 2. 클러드 코드 클러드 코드. 클러드 코드 사용법1. 클러드 코드 사용법2. 2. open llm model 사용 가능 솔루션. 1. continue + LLM continue. contin...