Skip to content

从专家(人类)经验中学习一个打分器,然后通过这个打分器给自己的动作打分,查看其是否符合专家的行为,这个分数用于正则环境的奖励。

License

Notifications You must be signed in to change notification settings

ZhuShaoQiang/RLFC

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

41 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

注意 attention

这个是RLFC v1版本,内部代码不再更新。请等待RLFC v2代码,这个代码正在路上。。。。。。 This is RLFC v1 which will not be updated, please wait for RLFC v2.....

FVRL

这个项目是为了从专家经验中(或者仅仅是成功经验中)学习一个打分器,这个经验可以是视频(图像输入环境),也可以是一个线路(网格世界),有了专家经验之后,可以更好的让agent学习,更快的学习。

目录介绍

ckp

存放输出的日志、输出的模型的文件夹

config

各个配置文件存储的目录

Lib

用于存放各种自己写的库的目录

main

用于存放各个运行文件的目录,训练、评估等都在此处进行

exp

用于存放经验

实验性编码

首先进行实验性编码,使用网格世界,设计了两个实验,查看效果是否不错

About

从专家(人类)经验中学习一个打分器,然后通过这个打分器给自己的动作打分,查看其是否符合专家的行为,这个分数用于正则环境的奖励。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages