Skip to content

rrrrind/reinforcement-learning

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

38 Commits
 
 
 
 
 
 
 
 

Repository files navigation

強化学習

このリポジトリは,強化学習に関するアルゴリズムをJupyterLab, python, pytorch, OpenAIを用いて実装することで,アルゴリズムの理解やpythonのライブラリに慣れることを目的としております.

実装済み

  • 動的計画法を用いた状態価値関数値の導出
  • 動的計画法を用いた行動価値関数値の導出
  • 反復方策評価
  • 再帰処理と反復処理の比較
  • モンテカルロ法
  • モンテカルロ法を用いたCartPole問題の解決

実装中

  • TD法を用いた価値関数値の導出
  • Sarsaを用いたMountainCarの実装

注意事項

  • Jupyter上でファイルを開くことを想定しているため,Github上で~.ipynbを開くとフォーマットが少し崩れることがあります.
  • OpenAI Gymは(Macの場合),Xhostコマンドを実行し,Xtermを起動させてから実行させてください.

reinforcement-learning

Implementation about Reinforcement Learning Algorithms.
For example, Dynamic programing, Monte Carlo method, Temporal Difference Learning, Deep Q Learning, and so on.
Exercise using JupyterLab, python, pytorch, OpenAI.

About

Implementations of Reinforcement Learning Algorithms.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published