이제 본격적으로 Cartpole 을 DQN 으로 구현해보자! 지금까지 FrozenLake 4x4 와 8x8 을 풀면서 강화학습과 DQN 이론을 모두 다뤘으므로 자세한 설명은 생략한다.
전체 소스코드는 다음과 같다. FrozenLake 때와 논리가 완전히 같다.
다만, 다음과 같은 코드가 추가됐는데 이건 실제 학습이 제대로 됐는지 시각적으로 확인하려고 신경망을 파일 형태로 저장한다. 이제 실행해보자.
초반 에피소드에는 100 이상도 못 버틴다. 계속 학습해보자.
후반부에는 200까지 버티는 모습을 볼 수 있다. * Cartpole 자체가 200 이상 버티면 자동으로 종료하게 되어 있어 얼마나 더 버티는지는 확인 불가 모든 학습이 끝나면 코랩에 다음과 같은 파일이 생성된..........
[인공지능] RL(강화학습) 6강 -Carpole 구현 with DQN에 대한 요약내용입니다.
자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.