벨만 방정식 감마
-
강화학습 기초 - 강화학습, 벨만 방정식전공 - AI/강화학습 2023. 9. 24. 15:23
유데미 강의를 참고하여 글을 작성하였습니다 목차 1. 강화학습 2. 벨만 방정식 강화학습 강화학습(Reinforcement learning)은 머신러닝의 한 종류로, 행동을 수행하는 학습자가 어떤 행동을 해야 하는지 알지 못하는 상태에서 행동에 대한 보상을 극대화하기 위해 어떻게 행동해야 할지 방향을 찾는 학습 방법이다 가상의 학습공간을 환경이라고 하고 가상의 학습공간에서 우리를 대신해 학습을 할 대상을 대리인이라 한다 위와 같은 미로가 있고 성공으로 들어가면 +1, 실패로 들어가면 -1 이라는 최종 보상을 받는다고 가정하자 대리인은 지금 여기가 어디인지 아무것도 모르는 상태이기 때문에 왼쪽으로 갔다 오른쪽으로 갔다 위로 갔다 열심히 탐색을 한다 열심히 탐색을 하는데 우연히 위의 경로로 이동을 했고 성공..