OpenAI Gym

An open-source toolkit from OpenAI that implements several Reinforcement Learning benchmarks including: classic control, Atari, Robotics and MuJoCo tasks.

(Description by Evolutionary learning of interpretable decision trees)

(Image Credit: OpenAI Gym)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 382 papers

Title	Date	Tasks	Status
VisualEnv: visual Gym environments with Blender	Nov 15, 2021	OpenAI Gymreinforcement-learning	—Unverified
DriverGym: Democratising Reinforcement Learning for Autonomous Driving	Nov 12, 2021	Autonomous DrivingOpenAI Gym	—Unverified
AWD3: Dynamic Reduction of the Estimation Bias	Nov 12, 2021	continuous-controlContinuous Control	—Unverified
Proximal Policy Optimization with Continuous Bounded Action Space via the Beta Distribution	Nov 3, 2021	continuous-controlContinuous Control	—Unverified
Machine Learning aided Crop Yield Optimization	Nov 1, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
DESTA: A Framework for Safe Reinforcement Learning with Markov Games of Intervention	Oct 27, 2021	OpenAI Gymreinforcement-learning	—Unverified
REIN-2: Giving Birth to Prepared Reinforcement Learning Agents Using Reinforcement Learning Agents	Oct 11, 2021	Deep Reinforcement LearningMeta-Learning	—Unverified
Compositional Q-learning for electrolyte repletion with imbalanced patient sub-populations	Oct 6, 2021	Decision MakingNavigate	—Unverified
Imaginary Hindsight Experience Replay: Curious Model-based Learning for Sparse Reward Tasks	Oct 5, 2021	FetchPush-v1Model-based Reinforcement Learning	—Unverified
Benchmarking Algorithms from Machine Learning for Low-Budget Black-Box Optimization	Sep 29, 2021	Bayesian OptimizationBenchmarking	—Unverified
Hypothesis Driven Coordinate Ascent for Reinforcement Learning	Sep 29, 2021	MuJoCoOpenAI Gym	—Unverified
Nested Policy Reinforcement Learning for Clinical Decision Support	Sep 29, 2021	Decision MakingNavigate	—Unverified
Untangling Braids with Multi-agent Q-Learning	Sep 29, 2021	OpenAI GymQ-Learning	—Unverified
CrowdPlay: Crowdsourcing human demonstration data for offline learning in Atari games	Sep 29, 2021	Atari GamesDecision Making	—Unverified
Experience Replay More When It's a Key Transition in Deep Reinforcement Learning	Sep 29, 2021	Deep Reinforcement LearningOpenAI Gym	—Unverified
Estimation Error Correction in Deep Reinforcement Learning for Deterministic Actor-Critic Methods	Sep 22, 2021	continuous-controlContinuous Control	CodeCode Available
Membership Inference Attacks Against Temporally Correlated Data in Deep Reinforcement Learning	Sep 8, 2021	Adversarial Attackcontinuous-control	—Unverified
An Oracle and Observations for the OpenAI Gym / ALE Freeway Environment	Sep 2, 2021	OpenAI Gymreinforcement-learning	—Unverified
Catastrophic Interference in Reinforcement Learning: A Solution Based on Context Division and Knowledge Distillation	Sep 1, 2021	Deep Reinforcement LearningGeneral Reinforcement Learning	CodeCode Available
Photonic Quantum Policy Learning in OpenAI Gym	Aug 29, 2021	BIG-bench Machine Learningcontinuous-control	—Unverified
Influence-Based Reinforcement Learning for Intrinsically-Motivated Agents	Aug 28, 2021	counterfactualMulti-agent Reinforcement Learning	—Unverified
An Independent Study of Reinforcement Learning and Autonomous Driving	Aug 20, 2021	Autonomous DrivingOpenAI Gym	—Unverified
An Analysis of Reinforcement Learning for Malaria Control	Jul 19, 2021	Multi-Armed BanditsOpenAI Gym	—Unverified
Constrained Policy Gradient Method for Safe and Fast Reinforcement Learning: a Neural Tangent Kernel Based Approach	Jul 19, 2021	OpenAI Gym	CodeCode Available
Population-coding and Dynamic-neurons improved Spiking Actor Network for Reinforcement Learning	Jun 15, 2021	Deep Reinforcement LearningOpenAI Gym	—Unverified
Offline Inverse Reinforcement Learning	Jun 9, 2021	Data AugmentationImitation Learning	—Unverified
Exploration and preference satisfaction trade-off in reward-free learning	Jun 8, 2021	OpenAI Gym	—Unverified
AppBuddy: Learning to Accomplish Tasks in Mobile Apps via Reinforcement Learning	May 31, 2021	OpenAI Gymreinforcement-learning	—Unverified
Affine Transport for Sim-to-Real Domain Adaptation	May 25, 2021	Domain AdaptationOpenAI Gym	—Unverified
A Generalised Inverse Reinforcement Learning Framework	May 25, 2021	OpenAI Gymreinforcement-learning	—Unverified
Controlling an Inverted Pendulum with Policy Gradient Methods-A Tutorial	May 17, 2021	OpenAI GymPolicy Gradient Methods	—Unverified
RAIL: A modular framework for Reinforcement-learning-based Adversarial Imitation Learning	May 8, 2021	Imitation LearningOpenAI Gym	—Unverified
Utilizing Skipped Frames in Action Repeats via Pseudo-Actions	May 7, 2021	continuous-controlContinuous Control	—Unverified
Implementing Reinforcement Learning Algorithms in Retail Supply Chains with OpenAI Gym Toolkit	Apr 27, 2021	Demand ForecastingManagement	—Unverified
Reinforcement Learning using Guided Observability	Apr 22, 2021	Decision MakingMuJoCo	—Unverified
Policy Information Capacity: Information-Theoretic Measure for Task Complexity in Deep Reinforcement Learning	Mar 23, 2021	continuous-controlContinuous Control	CodeCode Available
Optimism is All You Need: Model-Based Imitation Learning From Observation Alone	Mar 9, 2021	AllImitation Learning	—Unverified
Foresee then Evaluate: Decomposing Value Estimation with Latent Future Prediction	Mar 3, 2021	continuous-controlContinuous Control	CodeCode Available
Modular Deep Reinforcement Learning for Continuous Motion Planning with Temporal Logic	Feb 24, 2021	Deep Reinforcement LearningMotion Planning	CodeCode Available
MobILE: Model-Based Imitation Learning From Observation Alone	Feb 22, 2021	Imitation Learningmodel	CodeCode Available
Sim-Env: Decoupling OpenAI Gym Environments from Simulation Models	Feb 19, 2021	OpenAI Gymreinforcement-learning	CodeCode Available
Transferring Domain Knowledge with an Adviser in Continuous Tasks	Feb 16, 2021	OpenAI Gymreinforcement-learning	—Unverified
Learning from Demonstrations using Signal Temporal Logic	Feb 15, 2021	OpenAI Gymreinforcement-learning	—Unverified
Neurogenetic Programming Framework for Explainable Reinforcement Learning	Feb 8, 2021	OpenAI Gymreinforcement-learning	CodeCode Available
Improving Reinforcement Learning with Human Assistance: An Argument for Human Subject Studies with HIPPO Gym	Feb 2, 2021	OpenAI GymReinforcement Learning (RL)	—Unverified
BF++: a language for general-purpose program synthesis	Jan 23, 2021	Decision MakingOpenAI Gym	CodeCode Available
Faults in Deep Reinforcement Learning Programs: A Taxonomy and A Detection Approach	Jan 1, 2021	Deep Reinforcement LearningFault Detection	CodeCode Available
Deep Q Learning from Dynamic Demonstration with Behavioral Cloning	Jan 1, 2021	Deep Reinforcement LearningOpenAI Gym	—Unverified
Error Controlled Actor-Critic Method to Reinforcement Learning	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Towards Understanding Asynchronous Advantage Actor-critic: Convergence and Linear Speedup	Dec 31, 2020	Atari GamesOpenAI Gym	—Unverified

Show:10 25 50

← PrevPage 5 of 8Next →

All datasets Ant-v4 HalfCheetah-v4 Hopper-v4 Humanoid-v4 Walker2d-v4 Ant-v2 CartPole-v1 HalfCheetah-v2 Hopper-v2 LunarLander-v2 Mountain Car Pendulum-v1

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	6,586.33	—	Unverified
2	TD3	Average Return	5,942.55	—	Unverified
3	SAC	Average Return	5,208.09	—	Unverified
4	DDPG	Average Return	1,712.12	—	Unverified
5	PPO	Average Return	608.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Average Return	15,836.04	—	Unverified
2	DDPG	Average Return	14,934.86	—	Unverified
3	TD3	Average Return	12,026.73	—	Unverified
4	MEow	Average Return	10,981.47	—	Unverified
5	PPO	Average Return	6,006.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	3,332.99	—	Unverified
2	TD3	Average Return	3,319.98	—	Unverified
3	SAC	Average Return	2,882.56	—	Unverified
4	DDPG	Average Return	1,290.24	—	Unverified
5	PPO	Average Return	790.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MEow	Average Return	6,923.22	—	Unverified
2	SAC	Average Return	6,211.5	—	Unverified
3	PPO	Average Return	925.89	—	Unverified
4	TD3	Average Return	198.44	—	Unverified
5	DDPG	Average Return	139.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Average Return	5,745.27	—	Unverified
2	MEow	Average Return	5,526.66	—	Unverified
3	DDPG	Average Return	2,994.54	—	Unverified
4	PPO	Average Return	2,739.81	—	Unverified
5	TD3	Average Return	2,612.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	5,163.54	—	Unverified
2	AWR	Mean Reward	5,067	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Orthogonal decision tree	Average Return	500	—	Unverified
2	Oblique decision tree	Average Return	500	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	9,571.99	—	Unverified
2	AWR	Mean Reward	9,136	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	3,458.22	—	Unverified
2	AWR	Mean Reward	3,405	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Oblique decision tree	Average Return	272.14	—	Unverified
2	AWR	Average Return	229	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Orthogonal decision tree	Average Return	-101.72	—	Unverified
2	Oblique decision tree	Average Return	-106.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA with Hierarchical Reward Functions	Mean Reward	-125.02	—	Unverified
2	TLA	Mean Reward	-154.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AWR	Mean Reward	5,813	—	Unverified
2	TLA	Mean Reward	3,878.41	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AWR	Average Return	4,996	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	9,356.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	1,000	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TLA	Mean Reward	93.88	—	Unverified