심층 Q-네트워크(Deep Q-Networks, DQN)

DQN은 강화 학습을 위한 가장 최신 딥 러닝 모델로 구글 딥마인드(Google DeepMind)에서 개발한 알고리즘으로, 2015년 2월 <네이처(Nature)>에 소개되었다. 강화 학습은 동물이 학습하는 방법을 모방한 인공지능 방법론이다.

동물 행동심리학에서 ‘스키너의 상자’로 알려진 실험이 모티브가 되었는데, 해당 실험은 상자 내부에 쥐와 누르면 먹이가 나오는 지렛대를 함께 두는 방식으로 진행된다. 처음에 무작위 행동을 하던 쥐는 지렛대를 누르면 먹이가 나오는 것을 확인한다.

시간이 지날수록 쥐는 더 높은 빈도수로 지렛대를 누르는데, 이렇게 어떠한 보상(먹이)이 행동(지렛대를 누르는 행위)을 ‘강화’하는 것을 관찰할 수 있다. 해당 실험과 매우 유사한 구조를 갖는 강화 학습은 행동 주체가 자기를 둘러싼 ‘환경’에서 ‘보상’을 받으면서 환경에 대해 배워나가는 인공지능 방법론이다. 2016년 이세돌 9단과의 대국에서 승리한 구글 딥마인드의 ‘알파고(AlphaGo)’가 대표 사례다....

요청 처리 중입니다...

심층 Q-네트워크(Deep Q-Networks, DQN)

등록된 다른 글