전공 - AI
-
-
-
-
-
강화학습 기초 - 강화학습, 벨만 방정식전공 - AI/강화학습 2023. 9. 24. 15:23
유데미 강의를 참고하여 글을 작성하였습니다 목차 1. 강화학습 2. 벨만 방정식 강화학습 강화학습(Reinforcement learning)은 머신러닝의 한 종류로, 행동을 수행하는 학습자가 어떤 행동을 해야 하는지 알지 못하는 상태에서 행동에 대한 보상을 극대화하기 위해 어떻게 행동해야 할지 방향을 찾는 학습 방법이다 가상의 학습공간을 환경이라고 하고 가상의 학습공간에서 우리를 대신해 학습을 할 대상을 대리인이라 한다 위와 같은 미로가 있고 성공으로 들어가면 +1, 실패로 들어가면 -1 이라는 최종 보상을 받는다고 가정하자 대리인은 지금 여기가 어디인지 아무것도 모르는 상태이기 때문에 왼쪽으로 갔다 오른쪽으로 갔다 위로 갔다 열심히 탐색을 한다 열심히 탐색을 하는데 우연히 위의 경로로 이동을 했고 성공..
-
강화학습 기초 - 경사하강법, 확률적 경사하강법, 역전파전공 - AI/강화학습 2023. 9. 24. 12:51
유데미 강의를 참고하여 글을 작성하였습니다 목차 1. 경사하강법 2. 확률적 경사하강법 3. 역전파 경사하강법 경사하강법이란 함수의 기울기(경사)를 구하고 경사의 반대 방향으로 계속 이동시켜 극값에 이를 때까지 반복시키는 것이다 ( 기울기가 0이 될 때까지 ) 위와 같은 곡선에 파란색 공이 있다고 가정하겠다 ( 이전 글에 나온 비용함수의 그래프이며 파란색선은 기울기이다 ) 이 공이 아래로 굴러가면 반대쪽에서 더이상 가지 못하고 멈추게 된다 이 지점에서의 기울기는 양수이다 다시 반대쪽으로 굴러가면 위와 같은 그림이 되며 기울기는 음수이다 최종적으로 위와 같이 기울기가 0인 위치에 도달하게 된다 이해를 쉽게 하기위해 공이 굴러가는 것으로 표현하였고 실제 모습은 위와 같다 Gradient Disent( 경사하..
-
강화학습 기초 - 신경망 작동 방법, 신경망 학습 방법전공 - AI/강화학습 2023. 9. 24. 12:28
유데미 강의를 참고하여 글을 작성하였습니다 목차 1. 신경망 작동 방법 2. 신경망 학습 방법 신경망 작동 방법 부동산을 예로 들어 설명하겠다 입력값에는 집의 면적, 방의 개수, 도시와의 거리, 건물의 나이로 총 4개의 입력값이 있다 그리고 입력값에 해당하는 가중치를 곱한 값들의 합이 최종 결과인 가격이 된다 이 상태에서 중간에 Hidden Layer가 생성되고 각각의 이름의 위와 같이 정했다 짱구는 면적, 방의 개수가 중요하고 도시와의 거리, 건물의 나이는 중요하지 않게 생각한다 짱구에게 면적과 방의 개수만 중요하므로 도시와의 거리, 건물의 나이는 삭제하였다 짱구와 같은 방법으로 다른 친구들에게도 각각 중요하게 생각하는 것들만 연결해 보았다 여러 사람이 중요하게 생각하는 것들을 하나로 모으면 집을 지을..
-
강화학습 기초 - 뉴런, 활성화 함수전공 - AI/강화학습 2023. 9. 24. 12:04
유데미 강의를 참고하여 글을 작성하였습니다 목차 1. 뉴런이란? 2. 활성화 함수 뉴런이란? 사람의 뇌에서 뉴런은 신경전달물질을 통해 신호를 전달하고 정보를 받아들이며 처리하는 역할을 수행한다 위 사진에서 뉴런을 초록색 원으로 표현하였다 X라는 신호가 들어오면 이 신호들을 처리하고 y라는 결과를 만든다 입력값을 X, 출력값을 Y라고 하였을 경우 위와 같이 Input Layer와 Output Layer로 나누어진다 입력값들 중에서 반드시 처리해야 할 만큼 중요한 정보가 있을 것이고 처리하지 않아도 되는 정보가 있을 것이다 이 값들을 구분하기 위해서 가중치를 두어 중요한 것에는 가중치를 더 추가하고 중요하지 않은 것에는 가중치를 제거하는 방식으로 정보를 처리할 수 있다 가중치가 추가되면 위와 같이 뉴런은 가..