OpenAI Gym

An open-source toolkit from OpenAI that implements several Reinforcement Learning benchmarks including: classic control, Atari, Robotics and MuJoCo tasks.

(Description by Evolutionary learning of interpretable decision trees)

(Image Credit: OpenAI Gym)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 382 papers

Title	Date	Tasks	Status	Hype
Machine Learning aided Crop Yield Optimization	Nov 1, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified	0
DESTA: A Framework for Safe Reinforcement Learning with Markov Games of Intervention	Oct 27, 2021	OpenAI Gymreinforcement-learning	—Unverified	0
ABIDES-Gym: Gym Environments for Multi-Agent Discrete Event Simulation and Application to Financial Markets	Oct 27, 2021	OpenAI GymReinforcement Learning (RL)	CodeCode Available	1
REIN-2: Giving Birth to Prepared Reinforcement Learning Agents Using Reinforcement Learning Agents	Oct 11, 2021	Deep Reinforcement LearningMeta-Learning	—Unverified	0
Compositional Q-learning for electrolyte repletion with imbalanced patient sub-populations	Oct 6, 2021	Decision MakingNavigate	—Unverified	0
Imaginary Hindsight Experience Replay: Curious Model-based Learning for Sparse Reward Tasks	Oct 5, 2021	FetchPush-v1Model-based Reinforcement Learning	—Unverified	0
Nested Policy Reinforcement Learning for Clinical Decision Support	Sep 29, 2021	Decision MakingNavigate	—Unverified	0
Experience Replay More When It's a Key Transition in Deep Reinforcement Learning	Sep 29, 2021	Deep Reinforcement LearningOpenAI Gym	—Unverified	0
Hypothesis Driven Coordinate Ascent for Reinforcement Learning	Sep 29, 2021	MuJoCoOpenAI Gym	—Unverified	0
Benchmarking Algorithms from Machine Learning for Low-Budget Black-Box Optimization	Sep 29, 2021	Bayesian OptimizationBenchmarking	—Unverified	0
CrowdPlay: Crowdsourcing human demonstration data for offline learning in Atari games	Sep 29, 2021	Atari GamesDecision Making	—Unverified	0
Untangling Braids with Multi-agent Q-Learning	Sep 29, 2021	OpenAI GymQ-Learning	—Unverified	0
Stackelberg Actor-Critic: Game-Theoretic Reinforcement Learning Algorithms	Sep 25, 2021	OpenAI Gymreinforcement-learning	CodeCode Available	1
Estimation Error Correction in Deep Reinforcement Learning for Deterministic Actor-Critic Methods	Sep 22, 2021	continuous-controlContinuous Control	CodeCode Available	0
CompilerGym: Robust, Performant Compiler Optimization Environments for AI Research	Sep 17, 2021	Compiler OptimizationOpenAI Gym	CodeCode Available	1
PowerGym: A Reinforcement Learning Environment for Volt-Var Control in Power Distribution Systems	Sep 8, 2021	OpenAI Gymreinforcement-learning	CodeCode Available	1
Membership Inference Attacks Against Temporally Correlated Data in Deep Reinforcement Learning	Sep 8, 2021	Adversarial Attackcontinuous-control	—Unverified	0
An Oracle and Observations for the OpenAI Gym / ALE Freeway Environment	Sep 2, 2021	OpenAI Gymreinforcement-learning	—Unverified	0
Catastrophic Interference in Reinforcement Learning: A Solution Based on Context Division and Knowledge Distillation	Sep 1, 2021	Deep Reinforcement LearningGeneral Reinforcement Learning	CodeCode Available	0
Photonic Quantum Policy Learning in OpenAI Gym	Aug 29, 2021	BIG-bench Machine Learningcontinuous-control	—Unverified	0
Influence-Based Reinforcement Learning for Intrinsically-Motivated Agents	Aug 28, 2021	counterfactualMulti-agent Reinforcement Learning	—Unverified	0
An Independent Study of Reinforcement Learning and Autonomous Driving	Aug 20, 2021	Autonomous DrivingOpenAI Gym	—Unverified	0
MarsExplorer: Exploration of Unknown Terrains via Deep Reinforcement Learning and Procedurally Generated Environments	Jul 21, 2021	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	1
Constrained Policy Gradient Method for Safe and Fast Reinforcement Learning: a Neural Tangent Kernel Based Approach	Jul 19, 2021	OpenAI Gym	CodeCode Available	0
An Analysis of Reinforcement Learning for Malaria Control	Jul 19, 2021	Multi-Armed BanditsOpenAI Gym	—Unverified	0
Multi-Goal Reinforcement Learning environments for simulated Franka Emika Panda robot	Jun 25, 2021	Multi-Goal Reinforcement LearningOpenAI Gym	CodeCode Available	1
Brax -- A Differentiable Physics Engine for Large Scale Rigid Body Simulation	Jun 24, 2021	MuJoCoOpenAI Gym	CodeCode Available	2
Solving Continuous Control with Episodic Memory	Jun 16, 2021	continuous-controlContinuous Control	CodeCode Available	1
rSoccer: A Framework for Studying Reinforcement Learning in Small and Very Small Size Robot Soccer	Jun 15, 2021	OpenAI Gymreinforcement-learning	CodeCode Available	1
Population-coding and Dynamic-neurons improved Spiking Actor Network for Reinforcement Learning	Jun 15, 2021	Deep Reinforcement LearningOpenAI Gym	—Unverified	0
Offline Inverse Reinforcement Learning	Jun 9, 2021	Data AugmentationImitation Learning	—Unverified	0
Exploration and preference satisfaction trade-off in reward-free learning	Jun 8, 2021	OpenAI Gym	—Unverified	0
Dynamic Sparse Training for Deep Reinforcement Learning	Jun 8, 2021	continuous-controlContinuous Control	CodeCode Available	1
Decision Transformer: Reinforcement Learning via Sequence Modeling	Jun 2, 2021	Atari GamesD4RL	CodeCode Available	1
AppBuddy: Learning to Accomplish Tasks in Mobile Apps via Reinforcement Learning	May 31, 2021	OpenAI Gymreinforcement-learning	—Unverified	0
Affine Transport for Sim-to-Real Domain Adaptation	May 25, 2021	Domain AdaptationOpenAI Gym	—Unverified	0
A Generalised Inverse Reinforcement Learning Framework	May 25, 2021	OpenAI Gymreinforcement-learning	—Unverified	0
Controlling an Inverted Pendulum with Policy Gradient Methods-A Tutorial	May 17, 2021	OpenAI GymPolicy Gradient Methods	—Unverified	0
An Open-Source Multi-Goal Reinforcement Learning Environment for Robotic Manipulation with Pybullet	May 12, 2021	MuJoCoMulti-Goal Reinforcement Learning	CodeCode Available	1
A Reinforcement Learning Environment for Multi-Service UAV-enabled Wireless Systems	May 11, 2021	BenchmarkingEdge-computing	CodeCode Available	1
RAIL: A modular framework for Reinforcement-learning-based Adversarial Imitation Learning	May 8, 2021	Imitation LearningOpenAI Gym	—Unverified	0
Utilizing Skipped Frames in Action Repeats via Pseudo-Actions	May 7, 2021	continuous-controlContinuous Control	—Unverified	0
Implementing Reinforcement Learning Algorithms in Retail Supply Chains with OpenAI Gym Toolkit	Apr 27, 2021	Demand ForecastingManagement	—Unverified	0
Reinforcement Learning using Guided Observability	Apr 22, 2021	Decision MakingMuJoCo	—Unverified	0
CropGym: a Reinforcement Learning Environment for Crop Management	Apr 9, 2021	ManagementOpenAI Gym	CodeCode Available	1
Towards Real-World Deployment of Reinforcement Learning for Traffic Signal Control	Mar 30, 2021	CPUOpenAI Gym	CodeCode Available	1
Policy Information Capacity: Information-Theoretic Measure for Task Complexity in Deep Reinforcement Learning	Mar 23, 2021	continuous-controlContinuous Control	CodeCode Available	0
Optimism is All You Need: Model-Based Imitation Learning From Observation Alone	Mar 9, 2021	AllImitation Learning	—Unverified	0
The AI Arena: A Framework for Distributed Multi-Agent Reinforcement Learning	Mar 9, 2021	Multi-agent Reinforcement LearningOpenAI Gym	CodeCode Available	1
Learning to Fly -- a Gym Environment with PyBullet Physics for Reinforcement Learning of Multi-agent Quadcopter Control	Mar 3, 2021	BenchmarkingMulti-agent Reinforcement Learning	CodeCode Available	2

Show:10 25 50

← PrevPage 4 of 8Next →

All datasets Ant-v4 HalfCheetah-v4 Hopper-v4 Humanoid-v4 Walker2d-v4 Ant-v2 CartPole-v1 HalfCheetah-v2 Hopper-v2 LunarLander-v2 Mountain Car Pendulum-v1

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	6,586.33	—	Unverified
2	TD3	Average Return	5,942.55	—	Unverified
3	SAC	Average Return	5,208.09	—	Unverified
4	DDPG	Average Return	1,712.12	—	Unverified
5	PPO	Average Return	608.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Average Return	15,836.04	—	Unverified
2	DDPG	Average Return	14,934.86	—	Unverified
3	TD3	Average Return	12,026.73	—	Unverified
4	MEow	Average Return	10,981.47	—	Unverified
5	PPO	Average Return	6,006.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	3,332.99	—	Unverified
2	TD3	Average Return	3,319.98	—	Unverified
3	SAC	Average Return	2,882.56	—	Unverified
4	DDPG	Average Return	1,290.24	—	Unverified
5	PPO	Average Return	790.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	6,923.22	—	Unverified
2	SAC	Average Return	6,211.5	—	Unverified
3	PPO	Average Return	925.89	—	Unverified
4	TD3	Average Return	198.44	—	Unverified
5	DDPG	Average Return	139.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Average Return	5,745.27	—	Unverified
2	MEow	Average Return	5,526.66	—	Unverified
3	DDPG	Average Return	2,994.54	—	Unverified
4	PPO	Average Return	2,739.81	—	Unverified
5	TD3	Average Return	2,612.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	5,163.54	—	Unverified
2	AWR	Mean Reward	5,067	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Orthogonal decision tree	Average Return	500	—	Unverified
2	Oblique decision tree	Average Return	500	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	9,571.99	—	Unverified
2	AWR	Mean Reward	9,136	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	3,458.22	—	Unverified
2	AWR	Mean Reward	3,405	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Oblique decision tree	Average Return	272.14	—	Unverified
2	AWR	Average Return	229	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Orthogonal decision tree	Average Return	-101.72	—	Unverified
2	Oblique decision tree	Average Return	-106.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA with Hierarchical Reward Functions	Mean Reward	-125.02	—	Unverified
2	TLA	Mean Reward	-154.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AWR	Mean Reward	5,813	—	Unverified
2	TLA	Mean Reward	3,878.41	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AWR	Average Return	4,996	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	9,356.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	1,000	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	93.88	—	Unverified