OpenAI Gym

An open-source toolkit from OpenAI that implements several Reinforcement Learning benchmarks including: classic control, Atari, Robotics and MuJoCo tasks.

(Description by Evolutionary learning of interpretable decision trees)

(Image Credit: OpenAI Gym)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 382 papers

Title	Date	Tasks	Status	Hype
EvoX: A Distributed GPU-accelerated Framework for Scalable Evolutionary Computation	Jan 29, 2023	GPUNavigate	CodeCode Available	4
MO-Gym: A Library of Multi-Objective Reinforcement Learning Environments	Nov 30, 2022	Multi-Objective Reinforcement LearningOpenAI Gym	CodeCode Available	2
DIAMBRA Arena: a New Reinforcement Learning Platform for Research and Experimentation	Oct 19, 2022	Deep Reinforcement LearningImitation Learning	CodeCode Available	2
JORLDY: a fully customizable open source framework for reinforcement learning	Apr 11, 2022	MuJoCoOpenAI Gym	CodeCode Available	2
Brax -- A Differentiable Physics Engine for Large Scale Rigid Body Simulation	Jun 24, 2021	MuJoCoOpenAI Gym	CodeCode Available	2
Learning to Fly -- a Gym Environment with PyBullet Physics for Reinforcement Learning of Multi-agent Quadcopter Control	Mar 3, 2021	BenchmarkingMulti-agent Reinforcement Learning	CodeCode Available	2
Proximal Policy Optimization Algorithms	Jul 20, 2017	Continuous ControlDota 2	CodeCode Available	2
Mamba as Decision Maker: Exploring Multi-scale Sequence Modeling in Offline Reinforcement Learning	Jun 4, 2024	MambaOpenAI Gym	CodeCode Available	1
OMPO: A Unified Framework for RL under Policy and Dynamics Shifts	May 29, 2024	Domain AdaptationOpenAI Gym	CodeCode Available	1
Maximum Entropy Reinforcement Learning via Energy-Based Normalizing Flow	May 22, 2024	IngenuityMuJoCo	CodeCode Available	1
RFRL Gym: A Reinforcement Learning Testbed for Cognitive Radio Applications	Dec 20, 2023	OpenAI Gymreinforcement-learning	CodeCode Available	1
Peer Learning: Learning Complex Policies in Groups from Scratch via Action Recommendations	Dec 15, 2023	OpenAI Gymreinforcement-learning	CodeCode Available	1
LLF-Bench: Benchmark for Interactive Learning from Language Feedback	Dec 11, 2023	Information RetrievalOpenAI Gym	CodeCode Available	1
Can language agents be alternatives to PPO? A Preliminary Empirical Study On OpenAI Gym	Dec 6, 2023	BenchmarkingDecision Making	CodeCode Available	1
Controlgym: Large-Scale Control Environments for Benchmarking Reinforcement Learning Algorithms	Nov 30, 2023	BenchmarkingOpenAI Gym	CodeCode Available	1
Offline Retraining for Online RL: Decoupled Policy Learning to Mitigate Exploration Bias	Oct 12, 2023	D4RLOffline RL	CodeCode Available	1
qgym: A Gym for Training and Benchmarking RL-Based Quantum Compilation	Aug 1, 2023	BenchmarkingOpenAI Gym	CodeCode Available	1
For SALE: State-Action Representation Learning for Deep Reinforcement Learning	Jun 4, 2023	continuous-controlContinuous Control	CodeCode Available	1
PushWorld: A benchmark for manipulation planning with tools and movable obstacles	Jan 24, 2023	OpenAI GymStarcraft	CodeCode Available	1
pyRDDLGym: From RDDL to Gym Environments	Nov 11, 2022	OpenAI Gym	CodeCode Available	1
Design Process is a Reinforcement Learning Problem	Nov 6, 2022	Layout DesignOpenAI Gym	CodeCode Available	1
CaiRL: A High-Performance Reinforcement Learning Environment Toolkit	Oct 3, 2022	OpenAI Gymreinforcement-learning	CodeCode Available	1
COOL-MC: A Comprehensive Tool for Reinforcement Learning and Model Checking	Sep 15, 2022	OpenAI Gymreinforcement-learning	CodeCode Available	1
Bayesian Soft Actor-Critic: A Directed Acyclic Strategy Graph Based Deep Reinforcement Learning	Aug 11, 2022	continuous-controlContinuous Control	CodeCode Available	1
Avalanche RL: a Continual Reinforcement Learning Library	Feb 28, 2022	Continual LearningOpenAI Gym	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 16Next →

All datasets Ant-v4 HalfCheetah-v4 Hopper-v4 Humanoid-v4 Walker2d-v4 Ant-v2 CartPole-v1 HalfCheetah-v2 Hopper-v2 LunarLander-v2 Mountain Car Pendulum-v1

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	6,586.33	—	Unverified
2	TD3	Average Return	5,942.55	—	Unverified
3	SAC	Average Return	5,208.09	—	Unverified
4	DDPG	Average Return	1,712.12	—	Unverified
5	PPO	Average Return	608.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Average Return	15,836.04	—	Unverified
2	DDPG	Average Return	14,934.86	—	Unverified
3	TD3	Average Return	12,026.73	—	Unverified
4	MEow	Average Return	10,981.47	—	Unverified
5	PPO	Average Return	6,006.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	3,332.99	—	Unverified
2	TD3	Average Return	3,319.98	—	Unverified
3	SAC	Average Return	2,882.56	—	Unverified
4	DDPG	Average Return	1,290.24	—	Unverified
5	PPO	Average Return	790.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	6,923.22	—	Unverified
2	SAC	Average Return	6,211.5	—	Unverified
3	PPO	Average Return	925.89	—	Unverified
4	TD3	Average Return	198.44	—	Unverified
5	DDPG	Average Return	139.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Average Return	5,745.27	—	Unverified
2	MEow	Average Return	5,526.66	—	Unverified
3	DDPG	Average Return	2,994.54	—	Unverified
4	PPO	Average Return	2,739.81	—	Unverified
5	TD3	Average Return	2,612.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	5,163.54	—	Unverified
2	AWR	Mean Reward	5,067	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Orthogonal decision tree	Average Return	500	—	Unverified
2	Oblique decision tree	Average Return	500	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	9,571.99	—	Unverified
2	AWR	Mean Reward	9,136	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	3,458.22	—	Unverified
2	AWR	Mean Reward	3,405	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Oblique decision tree	Average Return	272.14	—	Unverified
2	AWR	Average Return	229	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Orthogonal decision tree	Average Return	-101.72	—	Unverified
2	Oblique decision tree	Average Return	-106.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA with Hierarchical Reward Functions	Mean Reward	-125.02	—	Unverified
2	TLA	Mean Reward	-154.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AWR	Mean Reward	5,813	—	Unverified
2	TLA	Mean Reward	3,878.41	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AWR	Average Return	4,996	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	9,356.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	1,000	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	93.88	—	Unverified