Example Dueling DQN implementation with ReLAx

This repository contains an implementation of dueling deep q-network (Dueling DQN) with ReLAx.

Dueling DQN actor was trained on Seaquest-v0 Atari Gym environment for 3m env-steps.

!Note: For demonstration purposes training was run only for 3m steps. In papers, DQN and its augmentations are trained for 200m steps, which may require several days of learning. That is why performance is lower than reported in papers.

The graph of average return vs environment step is shown below (logs done every 50k steps):

The distribution of estimated Q-values vs data Q-values is shown below:

Resulting Policy:

dueling_dqn_run.mp4

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.ipynb_checkpoints		.ipynb_checkpoints
content/video		content/video
monitor_train_logs		monitor_train_logs
tensorboard_logs/dueling_dqn_Seaquest-v0		tensorboard_logs/dueling_dqn_Seaquest-v0
trained_models		trained_models
README.md		README.md
dueling_dqn_q_func.png		dueling_dqn_q_func.png
dueling_dqn_training.png		dueling_dqn_training.png
dueling_dqn_tutorial.ipynb		dueling_dqn_tutorial.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Example Dueling DQN implementation with ReLAx

About

Releases

Packages

Languages

nslyubaykin/relax_dueling_dqn_example

Folders and files

Latest commit

History

Repository files navigation

Example Dueling DQN implementation with ReLAx

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages