[RL] 강화학습 기본 개념 - 에이전트(Agent), 상태(State), 행동(Action), 포상(Reward), 정책(Policy)
제 인생 첫 강화학습, 솔직히 그냥 안 하고 싶은데 그래도 일단 꾸역꾸역 시작해봅니다. 저는 Fundamental of Reinforcement Learning 페이지를 참고하여 공부하고 정리했습니다. 글 가장 아래에 Reference를 다시 남기도록 하겠습니다. 강화학습을 공부하면 나오는 기본 단어들 에이전트(Agent), 상태(State), 행동(Action), 포상(Reward), 정책(Policy) 강화학습의 시작은 Trial and error Optimal control 이 두 가지라고 합니다. 첫 번째는 시행 착오를 통해 변화한다는 특징, 두 번째는 어떤 비용함수의 비용을 최소화하도록 controler를 디자인하는 것을 의미합니다. 두 번째 문제는 Bellman equation(벨만 방정식)을..