proximal-policy-optimization

Here are 195 public repositories matching this topic...

jolle-ag / qdx

Quantum error correction code AI-discovery with Jax

reinforcement-learning gpu-computing proximal-policy-optimization jax quantum-error-correction stabilizer-code quantum-circuits clifford-circuits clifford-simulator

Updated Jul 1, 2024
Jupyter Notebook

vwxyzjn / cleanrl

Star

High-quality single file implementation of Deep Reinforcement Learning algorithms with research-friendly features (PPO, DQN, C51, DDPG, TD3, SAC, PPG)

python machine-learning reinforcement-learning deep-learning deep-reinforcement-learning pytorch gym atari actor-critic ale proximal-policy-optimization ppo advantage-actor-critic a2c wandb phasic-policy-gradient

Updated Jul 2, 2024
Python

EvZissel / expgen

Star

Official PyTorch implementation of ExpGen (NeurIPS'23).

reinforcement-learning deep-learning deep-reinforcement-learning pytorch proximal-policy-optimization ppo

Updated Jun 30, 2024
Python

AnasNeumann / gns

Star

Engineer-To-Order (ETO) Graph Neural Scheduling (GNS) Project

pytorch manufacturing proximal-policy-optimization ppo graphneuralnetwork pytorchgeometric engineer-to-order

Updated Jun 29, 2024
Python

asieradzk / RL_Matrix

Star

Deep Reinforcement Learning in C#

machine-learning reinforcement-learning deep-learning dotnet deep-reinforcement-learning multi-agent multi-environment dqn cartpole reinforcement-learning-algorithms sac proximal-policy-optimization ppo reinforcement-learning-agent gail multi-agent-reinforcement-learning reinforcement-learning-environments soft-actor-critic gail-ppo

Updated Jun 28, 2024
C#

stwerner97 / model-based-pde-control

Star

Numerical Evidence for Sample Efficiency of Model-Based over Model-Free Reinforcement Learning Control of Partial Differential Equations [ECC'24]

reinforcement-learning gym partial-differential-equations proximal-policy-optimization model-based-reinforcement-learning surrogate-models soft-actor-critic kuramoto-sivashinsky stable-baselines3 mbpo

Updated Jun 27, 2024
Python

VaradhKaushik / trade-recommendations

Star

This repository contains the implementation of a transformer-based model combined with a Proximal Policy Optimization (PPO) model to generate trade recommendations. The project leverages the predictive capabilities of transformers for price forecasting and the strategic decision-making of reinforcement learning.

transformer proximal-policy-optimization reinforement-learning trade-recommendations ai-in-finance

Updated Jun 27, 2024
Jupyter Notebook

colurw / snake_PPO

Star

Nokia's classic 'snake' game, written in NumPy and converted into a Gymnasium Environment() for use with gradient-based reinforcement learning algorithms

numpy pygame proximal-policy-optimization stable-baselines3 gymnasium-environment

Updated Jun 26, 2024
Python

philtabor / ProtoRL

Star

A Torch Based RL Framework for Rapid Prototyping of Research Papers

dqn ddpg sac actor-critic dueling-network-architecture dueling-dqn proximal-policy-optimization ppo prioritized-experience-replay td3 soft-actor-critic dqn-pytorch dueling-ddqn ddpg-pytorch dueling-dqn-pytorch ppo-pytorch sac-pytorch td3-pytorch twin-delayed-policy-gradient

Updated Jun 24, 2024
Python

ialexmp / DRL-Generalization

Star

Exploring Generalization in Deep Reinforcement Learning algorithms for different tasks using Gymnasium, Gymnasium-Robotics and MuJoCo

reinforcement-learning deep-learning deep-reinforcement-learning pytorch dqn gymnasium actor-critic generalization gym-environment proximal-policy-optimization pick-and-place ppo-pytorch control-tasks

Updated Jun 22, 2024
Python

fzvincent / HTransRL

Star

Hybrid Transformer based Multi-agent Reinforcement Learning (HTransRL) is for drone coordination in air corridors, addressing the challenges of dynamic dimensions and types of state inputs, which cannot addressed by the traditional MARL.

reinforcement-learning transformer multiagent-reinforcement-learning unmanned-aerial-vehicle proximal-policy-optimization urban-air-mobility air-corridor advanced-air-mobility

Updated Jun 20, 2024
Python

kwk2696 / sb3-jax-haiku

Star

stable-baselines with JAX & Haiku

reinforcement-learning imitation-learning diffusion haiku dataset-aggregation proximal-policy-optimization behavior-cloning jax soft-actor-critic dm-haiku decision-transformers

Updated Jun 20, 2024
Python

MarcoMeter / episodic-transformer-memory-ppo

Star

Clean baseline implementation of PPO using an episodic TransformerXL memory

deep-reinforcement-learning pytorch transformer policy-gradient pomdp actor-critic proximal-policy-optimization ppo on-policy episodic-memory transformer-xl gtrxl trxl gated-transformer-xl memory-gym

Updated Jun 18, 2024
Python

MaxNaeg / ZXreinforce

Star

Code for "Optimizing ZX-Diagrams with Deep Reinforcement Learning"

reinforcement-learning markov-decision-processes proximal-policy-optimization graph-neural-networks zx-calculus

Updated May 25, 2024
Python

zombie-einstein / JAX-PPO

Star

JAX Implementation of Proximal Policy Optimisation Algorithm

reinforcement-learning reinforcement-learning-algorithms rl proximal-policy-optimization ppo reinforcement-learning-agent jax

Updated May 15, 2024
Python

RsGoksel / Snake-Game_PPO-Solution

Star

Snake game environment integrated with OpenAI Gym. Proximal Policy Optimization (PPO) implementation for training. Visualization of training progress and agent performance. Easy to understand code.