OpenAI Gym

An open-source toolkit from OpenAI that implements several Reinforcement Learning benchmarks including: classic control, Atari, Robotics and MuJoCo tasks.

(Description by Evolutionary learning of interpretable decision trees)

(Image Credit: OpenAI Gym)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 382 papers

Title	Date	Tasks	Status
myGym: Modular Toolkit for Visuomotor Robotic Tasks	Dec 21, 2020	Imitation LearningOpenAI Gym	—Unverified
Evading Web Application Firewalls with Reinforcement Learning	Dec 14, 2020	OpenAI Gymreinforcement-learning	—Unverified
Evolutionary learning of interpretable decision trees	Dec 14, 2020	Evolutionary AlgorithmsOpenAI Gym	CodeCode Available
Resolving Implicit Coordination in Multi-Agent Deep Reinforcement Learning with Deep Q-Networks & Game Theory	Dec 8, 2020	Deep Reinforcement LearningOpenAI Gym	CodeCode Available
Control with adaptive Q-learning	Nov 3, 2020	OpenAI GymQ-Learning	CodeCode Available
Amortized Variational Deep Q Network	Nov 3, 2020	Deep Reinforcement LearningEfficient Exploration	CodeCode Available
LagNetViP: A Lagrangian Neural Network for Video Prediction	Oct 24, 2020	AcrobotOpenAI Gym	—Unverified
Proximal Policy Gradient: PPO with Policy Gradient	Oct 20, 2020	OpenAI Gym	—Unverified
A Learning Approach to Robot-Agnostic Force-Guided High Precision Assembly	Oct 15, 2020	OpenAI GymVocal Bursts Intensity Prediction	—Unverified
Deep Learning of Koopman Representation for Control	Oct 15, 2020	Deep LearningOpenAI Gym	—Unverified
MADRaS : Multi Agent Driving Simulator	Oct 2, 2020	Autonomous DrivingCar Racing	—Unverified
Deep Reinforcement Learning with Mixed Convolutional Network	Oct 1, 2020	Data AugmentationDeep Reinforcement Learning	—Unverified
MDP Playground: Controlling Orthogonal Dimensions of Hardness in Toy Environments	Sep 28, 2020	OpenAI GymReinforcement Learning (RL)	—Unverified
GRAC: Self-Guided and Self-Regularized Actor-Critic	Sep 18, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available
Evolutionary Selective Imitation: Interpretable Agents by Imitation Learning Without a Demonstrator	Sep 17, 2020	Imitation LearningOpenAI Gym	—Unverified
VacSIM: Learning Effective Strategies for COVID-19 Vaccine Distribution using Reinforcement Learning	Sep 14, 2020	Deep Reinforcement LearningMulti-Armed Bandits	CodeCode Available
Extended Radial Basis Function Controller for Reinforcement Learning	Sep 12, 2020	OpenAI Gymreinforcement-learning	—Unverified
Optimality-based Analysis of XCSF Compaction in Discrete Reinforcement Learning	Sep 3, 2020	OpenAI Gymreinforcement-learning	CodeCode Available
Reinforcement Learning with Quantum Variational Circuits	Aug 15, 2020	BIG-bench Machine LearningDeep Reinforcement Learning	CodeCode Available
Deep Q-Network Based Multi-agent Reinforcement Learning with Binary Action Agents	Aug 6, 2020	Multi-agent Reinforcement LearningOpenAI Gym	—Unverified
EasyRL: A Simple and Extensible Reinforcement Learning Framework	Aug 4, 2020	OpenAI Gymreinforcement-learning	—Unverified
EVO-RL: Evolutionary-Driven Reinforcement Learning	Jul 9, 2020	OpenAI Gymreinforcement-learning	—Unverified
Concept and the implementation of a tool to convert industry 4.0 environments modeled as FSM to an OpenAI Gym wrapper	Jun 29, 2020	OpenAI GymQ-Learning	—Unverified
Robust Reinforcement Learning using Least Squares Policy Iteration with Provable Performance Guarantees	Jun 20, 2020	OpenAI Gymreinforcement-learning	—Unverified
WD3: Taming the Estimation Bias in Deep Reinforcement Learning	Jun 18, 2020	continuous-controlContinuous Control	—Unverified
Data Driven Control with Learned Dynamics: Model-Based versus Model-Free Approach	Jun 16, 2020	continuous-controlContinuous Control	—Unverified
Balancing a CartPole System with Reinforcement Learning -- A Tutorial	Jun 8, 2020	OpenAI GymQ-Learning	—Unverified
Refined Continuous Control of DDPG Actors via Parametrised Activation	Jun 4, 2020	continuous-controlContinuous Control	—Unverified
An FPGA-Based On-Device Reinforcement Learning Approach using Online Sequential Learning	May 10, 2020	L2 RegularizationOpenAI Gym	—Unverified
Analyzing Reinforcement Learning Benchmarks with Random Weight Guessing	Apr 16, 2020	OpenAI Gymreinforcement-learning	CodeCode Available
Policy Gradient using Weak Derivatives for Reinforcement Learning	Apr 9, 2020	OpenAI Gymreinforcement-learning	—Unverified
Model-based actor-critic: GAN (model generator) + DRL (actor-critic) => AGI	Apr 4, 2020	modelOpenAI Gym	—Unverified
Human AI interaction loop training: New approach for interactive reinforcement learning	Mar 9, 2020	Decision MakingImitation Learning	—Unverified
Contextual Policy Transfer in Reinforcement Learning Domains via Deep Mixtures-of-Experts	Feb 29, 2020	Mixture-of-ExpertsOpenAI Gym	—Unverified
Behavior Cloning in OpenAI using Case Based Reasoning	Feb 23, 2020	OpenAI Gym	—Unverified
Adaptive Temporal Difference Learning with Linear Function Approximation	Feb 20, 2020	OpenAI Gymreinforcement-learning	—Unverified
Adaptive Experience Selection for Policy Gradient	Feb 17, 2020	continuous-controlContinuous Control	—Unverified
Discrete Action On-Policy Learning with Action-Value Critic	Feb 10, 2020	OpenAI GymReinforcement Learning	CodeCode Available
Continuous-action Reinforcement Learning for Playing Racing Games: Comparing SPG to PPO	Jan 15, 2020	OpenAI Gymreinforcement-learning	CodeCode Available
Sample-based Distributional Policy Gradient	Jan 8, 2020	Distributional Reinforcement LearningOpenAI Gym	—Unverified
Adaptive Droplet Routing in Digital Microfluidic Biochips Using Deep Reinforcement Learning	Jan 1, 2020	Deep Reinforcement LearningOpenAI Gym	—Unverified
Way Off-Policy Batch Deep Reinforcement Learning of Human Preferences in Dialog	Jan 1, 2020	Deep Reinforcement LearningOpenAI Gym	—Unverified
SLM Lab: A Comprehensive Benchmark and Modular Software Framework for Reproducible Deep Reinforcement Learning	Dec 28, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Taming an autonomous surface vehicle for path following and collision avoidance using deep reinforcement learning	Dec 18, 2019	Collision Avoidancecontinuous-control	—Unverified
Sepsis World Model: A MIMIC-based OpenAI Gym "World Model" Simulator for Sepsis Treatment	Dec 15, 2019	modelOpenAI Gym	—Unverified
The PlayStation Reinforcement Learning Environment (PSXLE)	Dec 12, 2019	OpenAI Gymreinforcement-learning	CodeCode Available
Playing Games in the Dark: An approach for cross-modality transfer in reinforcement learning	Nov 28, 2019	OpenAI Gymreinforcement-learning	CodeCode Available
Accelerating Reinforcement Learning with Suboptimal Guidance	Nov 21, 2019	OpenAI Gymreinforcement-learning	—Unverified
Gym-Ignition: Reproducible Robotic Simulations for Reinforcement Learning	Nov 5, 2019	OpenAI Gymreinforcement-learning	CodeCode Available
Challenging On Car Racing Problem from OpenAI gym	Nov 2, 2019	Car Racingcontinuous-control	—Unverified

Show:10 25 50

← PrevPage 6 of 8Next →

All datasets Ant-v4 HalfCheetah-v4 Hopper-v4 Humanoid-v4 Walker2d-v4 Ant-v2 CartPole-v1 HalfCheetah-v2 Hopper-v2 LunarLander-v2 Mountain Car Pendulum-v1

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	6,586.33	—	Unverified
2	TD3	Average Return	5,942.55	—	Unverified
3	SAC	Average Return	5,208.09	—	Unverified
4	DDPG	Average Return	1,712.12	—	Unverified
5	PPO	Average Return	608.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Average Return	15,836.04	—	Unverified
2	DDPG	Average Return	14,934.86	—	Unverified
3	TD3	Average Return	12,026.73	—	Unverified
4	MEow	Average Return	10,981.47	—	Unverified
5	PPO	Average Return	6,006.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	3,332.99	—	Unverified
2	TD3	Average Return	3,319.98	—	Unverified
3	SAC	Average Return	2,882.56	—	Unverified
4	DDPG	Average Return	1,290.24	—	Unverified
5	PPO	Average Return	790.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	6,923.22	—	Unverified
2	SAC	Average Return	6,211.5	—	Unverified
3	PPO	Average Return	925.89	—	Unverified
4	TD3	Average Return	198.44	—	Unverified
5	DDPG	Average Return	139.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Average Return	5,745.27	—	Unverified
2	MEow	Average Return	5,526.66	—	Unverified
3	DDPG	Average Return	2,994.54	—	Unverified
4	PPO	Average Return	2,739.81	—	Unverified
5	TD3	Average Return	2,612.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	5,163.54	—	Unverified
2	AWR	Mean Reward	5,067	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Orthogonal decision tree	Average Return	500	—	Unverified
2	Oblique decision tree	Average Return	500	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	9,571.99	—	Unverified
2	AWR	Mean Reward	9,136	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	3,458.22	—	Unverified
2	AWR	Mean Reward	3,405	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Oblique decision tree	Average Return	272.14	—	Unverified
2	AWR	Average Return	229	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Orthogonal decision tree	Average Return	-101.72	—	Unverified
2	Oblique decision tree	Average Return	-106.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA with Hierarchical Reward Functions	Mean Reward	-125.02	—	Unverified
2	TLA	Mean Reward	-154.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AWR	Mean Reward	5,813	—	Unverified
2	TLA	Mean Reward	3,878.41	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AWR	Average Return	4,996	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	9,356.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	1,000	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	93.88	—	Unverified