OpenAI Gym

An open-source toolkit from OpenAI that implements several Reinforcement Learning benchmarks including: classic control, Atari, Robotics and MuJoCo tasks.

(Description by Evolutionary learning of interpretable decision trees)

(Image Credit: OpenAI Gym)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 382 papers

Title	Date	Tasks	Status	Hype
Foresee then Evaluate: Decomposing Value Estimation with Latent Future Prediction	Mar 3, 2021	continuous-controlContinuous Control	CodeCode Available	0
Modular Deep Reinforcement Learning for Continuous Motion Planning with Temporal Logic	Feb 24, 2021	Deep Reinforcement LearningMotion Planning	CodeCode Available	0
MobILE: Model-Based Imitation Learning From Observation Alone	Feb 22, 2021	Imitation Learningmodel	CodeCode Available	0
Sim-Env: Decoupling OpenAI Gym Environments from Simulation Models	Feb 19, 2021	OpenAI Gymreinforcement-learning	CodeCode Available	0
Deluca -- A Differentiable Control Library: Environments, Methods, and Benchmarking	Feb 19, 2021	BenchmarkingOpenAI Gym	CodeCode Available	1
Transferring Domain Knowledge with an Adviser in Continuous Tasks	Feb 16, 2021	OpenAI Gymreinforcement-learning	—Unverified	0
Learning from Demonstrations using Signal Temporal Logic	Feb 15, 2021	OpenAI Gymreinforcement-learning	—Unverified	0
Improving Model-Based Reinforcement Learning with Internal State Representations through Self-Supervision	Feb 10, 2021	Board GamesModel-based Reinforcement Learning	CodeCode Available	1
Neurogenetic Programming Framework for Explainable Reinforcement Learning	Feb 8, 2021	OpenAI Gymreinforcement-learning	CodeCode Available	0
LongiControl: A Reinforcement Learning Environment for Longitudinal Vehicle Control	Feb 6, 2021	Autonomous DrivingOpenAI Gym	CodeCode Available	1
Explainable Reinforcement Learning for Longitudinal Control	Feb 6, 2021	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	1
Improving Reinforcement Learning with Human Assistance: An Argument for Human Subject Studies with HIPPO Gym	Feb 2, 2021	OpenAI GymReinforcement Learning (RL)	—Unverified	0
BF++: a language for general-purpose program synthesis	Jan 23, 2021	Decision MakingOpenAI Gym	CodeCode Available	0
Developing an OpenAI Gym-compatible framework and simulation environment for testing Deep Reinforcement Learning agents solving the Ambulance Location Problem	Jan 12, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
Faults in Deep Reinforcement Learning Programs: A Taxonomy and A Detection Approach	Jan 1, 2021	Deep Reinforcement LearningFault Detection	CodeCode Available	0
Error Controlled Actor-Critic Method to Reinforcement Learning	Jan 1, 2021	continuous-controlContinuous Control	—Unverified	0
Deep Q Learning from Dynamic Demonstration with Behavioral Cloning	Jan 1, 2021	Deep Reinforcement LearningOpenAI Gym	—Unverified	0
Towards Understanding Asynchronous Advantage Actor-critic: Convergence and Linear Speedup	Dec 31, 2020	Atari GamesOpenAI Gym	—Unverified	0
Reinforcement Learning for Control of Valves	Dec 29, 2020	OpenAI Gymreinforcement-learning	CodeCode Available	1
myGym: Modular Toolkit for Visuomotor Robotic Tasks	Dec 21, 2020	Imitation LearningOpenAI Gym	—Unverified	0
CityLearn: Standardizing Research in Multi-Agent Reinforcement Learning for Demand Response and Urban Energy Management	Dec 18, 2020	energy managementManagement	CodeCode Available	1
Evading Web Application Firewalls with Reinforcement Learning	Dec 14, 2020	OpenAI Gymreinforcement-learning	—Unverified	0
Evolutionary learning of interpretable decision trees	Dec 14, 2020	Evolutionary AlgorithmsOpenAI Gym	CodeCode Available	0
Resolving Implicit Coordination in Multi-Agent Deep Reinforcement Learning with Deep Q-Networks & Game Theory	Dec 8, 2020	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	0
NavRep: Unsupervised Representations for Reinforcement Learning of Robot Navigation in Dynamic Human Environments	Dec 8, 2020	OpenAI Gymreinforcement-learning	CodeCode Available	1
ACN-Sim: An Open-Source Simulator for Data-Driven Electric Vehicle Charging Research	Dec 4, 2020	OpenAI GymReinforcement Learning (RL)	CodeCode Available	1
Revisiting Maximum Entropy Inverse Reinforcement Learning: New Perspectives and Algorithms	Dec 1, 2020	OpenAI Gymreinforcement-learning	CodeCode Available	1
NLPGym -- A toolkit for evaluating RL agents on Natural Language Processing Tasks	Nov 16, 2020	Multi-Label ClassificationMUlTI-LABEL-ClASSIFICATION	CodeCode Available	1
Tonic: A Deep Reinforcement Learning Library for Fast Prototyping and Benchmarking	Nov 15, 2020	Benchmarkingcontinuous-control	CodeCode Available	1
SoftGym: Benchmarking Deep Reinforcement Learning for Deformable Object Manipulation	Nov 14, 2020	BenchmarkingDeep Reinforcement Learning	CodeCode Available	1
Ecole: A Gym-like Library for Machine Learning in Combinatorial Optimization Solvers	Nov 11, 2020	BIG-bench Machine LearningCombinatorial Optimization	CodeCode Available	1
Amortized Variational Deep Q Network	Nov 3, 2020	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	0
Control with adaptive Q-learning	Nov 3, 2020	OpenAI GymQ-Learning	CodeCode Available	0
LagNetViP: A Lagrangian Neural Network for Video Prediction	Oct 24, 2020	AcrobotOpenAI Gym	—Unverified	0
Proximal Policy Gradient: PPO with Policy Gradient	Oct 20, 2020	OpenAI Gym	—Unverified	0
Deep Reinforcement Learning with Population-Coded Spiking Neural Network for Continuous Control	Oct 19, 2020	continuous-controlContinuous Control	CodeCode Available	1
What About Inputing Policy in Value Function: Policy Representation and Policy-extended Value Function Approximator	Oct 19, 2020	continuous-controlContinuous Control	CodeCode Available	1
Deep Learning of Koopman Representation for Control	Oct 15, 2020	Deep LearningOpenAI Gym	—Unverified	0
A Learning Approach to Robot-Agnostic Force-Guided High Precision Assembly	Oct 15, 2020	OpenAI GymVocal Bursts Intensity Prediction	—Unverified	0
EpidemiOptim: A Toolbox for the Optimization of Control Policies in Epidemiological Models	Oct 9, 2020	Deep Reinforcement LearningEpidemiology	CodeCode Available	1
MADRaS : Multi Agent Driving Simulator	Oct 2, 2020	Autonomous DrivingCar Racing	—Unverified	0
Deep Reinforcement Learning with Mixed Convolutional Network	Oct 1, 2020	Data AugmentationDeep Reinforcement Learning	—Unverified	0
MDP Playground: Controlling Orthogonal Dimensions of Hardness in Toy Environments	Sep 28, 2020	OpenAI GymReinforcement Learning (RL)	—Unverified	0
GRAC: Self-Guided and Self-Regularized Actor-Critic	Sep 18, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Evolutionary Selective Imitation: Interpretable Agents by Imitation Learning Without a Demonstrator	Sep 17, 2020	Imitation LearningOpenAI Gym	—Unverified	0
VacSIM: Learning Effective Strategies for COVID-19 Vaccine Distribution using Reinforcement Learning	Sep 14, 2020	Deep Reinforcement LearningMulti-Armed Bandits	CodeCode Available	0
Extended Radial Basis Function Controller for Reinforcement Learning	Sep 12, 2020	OpenAI Gymreinforcement-learning	—Unverified	0
Optimality-based Analysis of XCSF Compaction in Discrete Reinforcement Learning	Sep 3, 2020	OpenAI Gymreinforcement-learning	CodeCode Available	0
On the model-based stochastic value gradient for continuous reinforcement learning	Aug 28, 2020	Continuous ControlHumanoid Control	CodeCode Available	1
Reinforcement Learning with Quantum Variational Circuits	Aug 15, 2020	BIG-bench Machine LearningDeep Reinforcement Learning	CodeCode Available	0

Show:10 25 50

← PrevPage 5 of 8Next →

All datasets Ant-v4 HalfCheetah-v4 Hopper-v4 Humanoid-v4 Walker2d-v4 Ant-v2 CartPole-v1 HalfCheetah-v2 Hopper-v2 LunarLander-v2 Mountain Car Pendulum-v1

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	6,586.33	—	Unverified
2	TD3	Average Return	5,942.55	—	Unverified
3	SAC	Average Return	5,208.09	—	Unverified
4	DDPG	Average Return	1,712.12	—	Unverified
5	PPO	Average Return	608.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Average Return	15,836.04	—	Unverified
2	DDPG	Average Return	14,934.86	—	Unverified
3	TD3	Average Return	12,026.73	—	Unverified
4	MEow	Average Return	10,981.47	—	Unverified
5	PPO	Average Return	6,006.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	3,332.99	—	Unverified
2	TD3	Average Return	3,319.98	—	Unverified
3	SAC	Average Return	2,882.56	—	Unverified
4	DDPG	Average Return	1,290.24	—	Unverified
5	PPO	Average Return	790.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	6,923.22	—	Unverified
2	SAC	Average Return	6,211.5	—	Unverified
3	PPO	Average Return	925.89	—	Unverified
4	TD3	Average Return	198.44	—	Unverified
5	DDPG	Average Return	139.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Average Return	5,745.27	—	Unverified
2	MEow	Average Return	5,526.66	—	Unverified
3	DDPG	Average Return	2,994.54	—	Unverified
4	PPO	Average Return	2,739.81	—	Unverified
5	TD3	Average Return	2,612.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	5,163.54	—	Unverified
2	AWR	Mean Reward	5,067	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Orthogonal decision tree	Average Return	500	—	Unverified
2	Oblique decision tree	Average Return	500	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	9,571.99	—	Unverified
2	AWR	Mean Reward	9,136	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	3,458.22	—	Unverified
2	AWR	Mean Reward	3,405	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Oblique decision tree	Average Return	272.14	—	Unverified
2	AWR	Average Return	229	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Orthogonal decision tree	Average Return	-101.72	—	Unverified
2	Oblique decision tree	Average Return	-106.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA with Hierarchical Reward Functions	Mean Reward	-125.02	—	Unverified
2	TLA	Mean Reward	-154.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AWR	Mean Reward	5,813	—	Unverified
2	TLA	Mean Reward	3,878.41	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AWR	Average Return	4,996	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	9,356.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	1,000	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	93.88	—	Unverified