hijkzzz

Follow

hijkzzz

Follow

RLer + MLSyser / 2 + NLPer / 2

634 followers · 52 following

Achievements

Achievements

hijkzzz/README.md

🔭 I'm a RLer + NLPer/2 + MLSyser/2.

Pinned Loading

OpenRLHF/OpenRLHF OpenRLHF/OpenRLHF Public

An Easy-to-use, Scalable and High-performance RLHF Framework based on Ray (PPO & GRPO & REINFORCE++ & vLLM & Ray & Dynamic Sampling & Async Agentic RL)

Python 8k 785
Awesome-LLM-Strawberry Awesome-LLM-Strawberry Public

A collection of LLM papers, blogs, and projects, with a focus on OpenAI o1 🍓 and reasoning techniques.

6.8k 376
pymarl2 pymarl2 Public

Fine-tuned MARL algorithms on SMAC (100% win rates on most scenarios)

Python 685 132
alpha-zero-gomoku alpha-zero-gomoku Public

A Multi-threaded Implementation of AlphaZero (C++)

Python 382 49
noisy-mappo noisy-mappo Public

Multi-agent PPO with noise (97% win rates on Hard scenarios of SMAC)

Python 68 6
cuda-neural-network cuda-neural-network Public

Convolutional Neural Network with CUDA (MNIST 99.23%)

C++ 195 40