초보자를 위한 강화학습 기본

less than 1 minute read

강화 학습이란

상황에 따라 보상을 최대로 하는 의사 결정을 하는 방법

강화학습의 요소

지도학습 : gpt, stable diffusion, copilot 등… 왜 강화 학습이 필요한걸까?? 사람이 생각하지 못하는 수에 대한 추론

Robot에서의 예..

Drone 예

GPT 마지막 단계
이미지 생성
chip design

input : state S
solution : action A
Model : policy

지도학습 vs 강화학습

강화 학습 예

Markov reward process

Markov decision process

강화 학습 용어

강화 학습 문제를 해결하는 방법(모방 학습)

참고자료

https://rail.eecs.berkeley.edu/deeprlcourse/

Share on

Twitter Facebook LinkedIn

[캡스톤 멘토링] 기획 리뷰 및 피벗 제안: Embodied AI 기반 스마트홈 에이전트 [가칭 홈도리]

4 minute read

🚀 캡스톤 디자인 기획 리뷰 및 피벗(Pivot) 제안 프로젝트: Indory ➔ Home-Dory (스마트홈 심부름 에이전트) 안녕하세요! 이번 1학기 캡스톤 디자인 멘토링을 맡게 되었습니다. 여러분이 작성한 ‘Indory (Indoor Delivery Agent)’ 기획서를 ...

뇌피셜 속초 맛집과 갈 만한곳

less than 1 minute read

송도 횟집 속초 앞바다에서 나는 가자미를 그날 그날 받아서 세꼬시 물회로 팝니다. 테카해서 드시면 미역국이랑 밥, 초장도 같이 제공해서 집에 가져와서 주로 먹습니다. ^^; 앞에 도로가 좁긴한데 차로 앞까지 올수 있으니 참고 하세요. 송도 횟집.

Figure AI ‘Helix 02’ 및 ‘Figure 03’ 기술 분석: 전신 자율 제어의 시작

2 minute read

최근 휴머노이드 로봇 분야의 선두 주자인 Figure AI가 새로운 하드웨어 ‘Figure 03’과 이를 제어하는 소프트웨어/AI 아키텍처 ‘Helix 02’를 공개했습니다. 단순한 하드웨어의 업그레이드를 넘어, 로봇이 스스로 환경을 인지하고 판단하여 전신을 제어하는 ‘Full-...

mujoco simul을 이용한 모터 선정

3 minute read

[MuJoCo] 시뮬레이션으로 로봇 모터 선정 검증하기 (Motor Sizing) 로봇을 설계할 때 가장 고민되는 부분 중 하나는 “이 모터가 과연 내가 원하는 동작을 버틸 수 있을까?” 입니다. 너무 약한 모터를 쓰면 움직이지 않고, 너무 강한 모터를 쓰면 무겁고 비싸집니다. ...

설악이