ChengpengLi1003

ChengpengLi ChengpengLi1003

Achievements

DotaMath DotaMath Public

29 2
Q-learning Q-learning Public

针对最经典的表格型Q learning算法进行了复现，能够支持gym中大多数的离散动作和状态空间的环境，譬如CliffWalking-v0。

Python 8 1
RL4CO RL4CO Public

A open-sourced codebase for using offline reinforcement learning in combinatorial optimization

Python 2
tensorflowbook tensorflowbook Public

Forked from csmhwu/tensorflowbook

for tensorflow book writting

1
MCRL MCRL Public

open-sourced code for kdd23

1
gsm8k-ScRel gsm8k-ScRel Public

Forked from OFA-Sys/gsm8k-ScRel

Codes and Data for Scaling Relationship on Learning Mathematical Reasoning with Large Language Models

Python 1