HalfCheetah

Имплементация алгоритмов DDPG и PPO.

Обучение и тестирование в среде Half-Cheetah из MuJoCo.

Статья про PPO, по которой писался алгоритм: https://arxiv.org/pdf/1707.06347.pdf

Запуск

Для запуска обучения алгоритма DDPG:

python3 train_ddpg.py

Для запуска обучения алгоритма PPO:

python3 train_ppo.py

На данный момент удалось достичь такого результата с помощью алгоритма PPO. Требуется доработка алгоритма и более тщательный подбор гиперпараметров.

walk_face.mp4

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
ddpg		ddpg
ppo		ppo
.gitignore		.gitignore
README.md		README.md
train_ddpg.py		train_ddpg.py
train_ppo.py		train_ppo.py
walk_face.mp4		walk_face.mp4