정확히 이야기하면 DDQN (Deep Double QN)이군요. 애초에 Q-Learning에 Deep 이 붙은 이유는 Q-Learning의 function을 deep neural network로 모사하자는 철학으로부터 시작하고, 여기에 Double Q-learning을 붙인 개념입니다. Q Learning의 장점은, 어떤 내재적 모델의 구조를 가정하지 않도고 강화학습을 할 수있다는 것입니다.
추후에 DDDQN (Dueling Double Deep Q-Network) 도 같이 살펴보시면 좋겠습니다.
Sarsa 혹은 Sarsa(lambda), TD(0) 등과도 한번 대비해서 살펴보세요. 응원드립니다. :)
피드백 감사드립니다~! 말씀해주신 내용 참고해서 내용을 수정했습니다.
링크해주신 github도 같이 살펴보도록 할게요~
Downvoting a post can decrease pending rewards and make it less visible. Common reasons:
Submit