Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–900 of 1161 papers

Title	Date	Tasks	Status	Hype
Safe reinforcement learning for probabilistic reachability and safety specifications: A Lyapunov-based approach	Feb 24, 2020	Autonomous Drivingcontinuous-control	CodeCode Available	0
Neural Lyapunov Model Predictive Control: Learning Safe Global Controllers from Sub-optimal Examples	Feb 21, 2020	continuous-controlContinuous Control	—Unverified	0
oIRL: Robust Adversarial Inverse Reinforcement Learning with Temporally Extended Actions	Feb 20, 2020	continuous-controlContinuous Control	—Unverified	0
Keep Doing What Worked: Behavioral Modelling Priors for Offline Reinforcement Learning	Feb 19, 2020	continuous-controlContinuous Control	—Unverified	0
KoGuN: Accelerating Deep Reinforcement Learning via Integrating Human Suboptimal Knowledge	Feb 18, 2020	Common Sense Reasoningcontinuous-control	—Unverified	0
Multi-Issue Bargaining With Deep Reinforcement Learning	Feb 18, 2020	continuous-controlContinuous Control	—Unverified	0
Adaptive Experience Selection for Policy Gradient	Feb 17, 2020	continuous-controlContinuous Control	—Unverified	0
Learning Functionally Decomposed Hierarchies for Continuous Control Tasks with Path Planning	Feb 14, 2020	continuous-controlContinuous Control	—Unverified	0
Reward Tweaking: Maximizing the Total Reward While Planning for Short Horizons	Feb 9, 2020	continuous-controlContinuous Control	—Unverified	0
Learning State Abstractions for Transfer in Continuous Control	Feb 8, 2020	continuous-controlContinuous Control	CodeCode Available	0
Off-policy Maximum Entropy Reinforcement Learning : Soft Actor-Critic with Advantage Weighted Mixture Policy(SAC-AWMP)	Feb 7, 2020	continuous-controlContinuous Control	—Unverified	0
Ready Policy One: World Building Through Active Learning	Feb 7, 2020	Active Learningcontinuous-control	—Unverified	0
Deep Radial-Basis Value Functions for Continuous Control	Feb 5, 2020	continuous-controlContinuous Control	—Unverified	0
Domain-Adversarial and Conditional State Space Model for Imitation Learning	Jan 31, 2020	continuous-controlContinuous Control	—Unverified	0
Q-Learning in enormous action spaces via amortized approximate maximization	Jan 22, 2020	continuous-controlContinuous Control	—Unverified	0
SEERL: Sample Efficient Ensemble Reinforcement Learning	Jan 15, 2020	continuous-controlContinuous Control	—Unverified	0
Reinforcement Learning Tracking Control for Robotic Manipulator With Kernel-Based Dynamic Model	Jan 9, 2020	continuous-controlContinuous Control	—Unverified	0
Distributional Soft Actor-Critic: Off-Policy Reinforcement Learning for Addressing Value Estimation Errors	Jan 9, 2020	continuous-controlContinuous Control	CodeCode Available	1
Batch Reinforcement Learning with Hyperparameter Gradients	Jan 1, 2020	continuous-controlContinuous Control	—Unverified	0
Variational Imitation Learning with Diverse-quality Demonstrations	Jan 1, 2020	continuous-controlContinuous Control	CodeCode Available	1
Inferring DQN structure for high-dimensional continuous control	Jan 1, 2020	continuous-controlContinuous Control	—Unverified	0
A Game Theoretic Perspective on Model-Based Reinforcement Learning	Jan 1, 2020	continuous-controlContinuous Control	—Unverified	0
CoMic: Co-Training and Mimicry for Reusable Skills	Jan 1, 2020	continuous-controlContinuous Control	—Unverified	0
Augmented Replay Memory in Reinforcement Learning With Continuous Control	Dec 29, 2019	continuous-controlContinuous Control	—Unverified	0
Crowdfunding Dynamics Tracking: A Reinforcement Learning Approach	Dec 27, 2019	continuous-controlContinuous Control	—Unverified	0
Quasi-Newton Trust Region Policy Optimization	Dec 26, 2019	continuous-controlContinuous Control	—Unverified	0
Taming an autonomous surface vehicle for path following and collision avoidance using deep reinforcement learning	Dec 18, 2019	Collision Avoidancecontinuous-control	—Unverified	0
Recruitment-imitation Mechanism for Evolutionary Reinforcement Learning	Dec 13, 2019	continuous-controlContinuous Control	—Unverified	0
Efficacy of Modern Neuro-Evolutionary Strategies for Continuous Control Optimization	Dec 11, 2019	continuous-controlContinuous Control	CodeCode Available	0
Doubly Robust Off-Policy Actor-Critic Algorithms for Reinforcement Learning	Dec 11, 2019	continuous-controlContinuous Control	—Unverified	0
Marginalized State Distribution Entropy Regularization in Policy Optimization	Dec 11, 2019	continuous-controlContinuous Control	—Unverified	0
Detecting Cyberattacks in Industrial Control Systems Using Online Learning Algorithms	Dec 8, 2019	continuous-controlContinuous Control	—Unverified	0
Dream to Control: Learning Behaviors by Latent Imagination	Dec 3, 2019	Continuous Controlreinforcement-learning	CodeCode Available	1
Policy Optimization Reinforcement Learning with Entropy Regularization	Dec 2, 2019	Continuous Controlreinforcement-learning	—Unverified	0
Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Gradient Estimators for Reinforcement Learning	Dec 1, 2019	continuous-controlContinuous Control	CodeCode Available	0
SMILe: Scalable Meta Inverse Reinforcement Learning through Context-Conditional Policies	Dec 1, 2019	continuous-controlContinuous Control	CodeCode Available	0
Better Exploration with Optimistic Actor Critic	Dec 1, 2019	continuous-controlContinuous Control	CodeCode Available	0
IMPACT: Importance Weighted Asynchronous Architectures with Clipped Target Networks	Nov 30, 2019	continuous-controlContinuous Control	—Unverified	0
Quadratic Q-network for Learning Continuous Control for Autonomous Vehicles	Nov 29, 2019	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Augmented Random Search for Quadcopter Control: An alternative to Reinforcement Learning	Nov 28, 2019	continuous-controlContinuous Control	—Unverified	0
Behavior Regularized Offline Reinforcement Learning	Nov 26, 2019	continuous-controlContinuous Control	—Unverified	0
Quantum Observables for continuous control of the Quantum Approximate Optimization Algorithm via Reinforcement Learning	Nov 21, 2019	continuous-controlContinuous Control	—Unverified	0
Evaluating task-agnostic exploration for fixed-batch learning of arbitrary future tasks	Nov 20, 2019	continuous-controlContinuous Control	CodeCode Available	0
Fuzzy Tiling Activations: A Simple Approach to Learning Sparse Representations Online	Nov 19, 2019	Continual Learningcontinuous-control	—Unverified	0
Off-Policy Policy Gradient Algorithms by Constraining the State Distribution Shift	Nov 16, 2019	continuous-controlContinuous Control	—Unverified	0
Improved Exploration through Latent Trajectory Optimization in Deep Deterministic Policy Gradient	Nov 15, 2019	continuous-controlContinuous Control	—Unverified	0
Online Replanning in Belief Space for Partially Observable Task and Motion Problems	Nov 11, 2019	continuous-controlContinuous Control	CodeCode Available	0
Real-Time Reinforcement Learning	Nov 11, 2019	continuous-controlContinuous Control	CodeCode Available	0
A Divergence Minimization Perspective on Imitation Learning Methods	Nov 6, 2019	Behavioural cloningcontinuous-control	CodeCode Available	1
Challenging On Car Racing Problem from OpenAI gym	Nov 2, 2019	Car Racingcontinuous-control	—Unverified	0

Show:10 25 50

← PrevPage 18 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified