Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 1161 papers

Title	Date	Tasks	Status	Hype
Learning the Linear Quadratic Regulator from Nonlinear Observations	Oct 8, 2020	continuous-controlContinuous Control	—Unverified	0
Reinforcement Learning for Many-Body Ground-State Preparation Inspired by Counterdiabatic Driving	Oct 7, 2020	continuous-controlContinuous Control	—Unverified	0
Reinforcement Learning with Random Delays	Oct 6, 2020	Anatomycontinuous-control	CodeCode Available	1
Learning Diverse Options via InfoMax Termination Critic	Oct 6, 2020	Continuous ControlDiversity	CodeCode Available	0
My Body is a Cage: the Role of Morphology in Graph-Based Incompatible Control	Oct 5, 2020	continuous-controlContinuous Control	CodeCode Available	1
Heteroscedastic Bayesian Optimisation for Stochastic Model Predictive Control	Oct 1, 2020	Bayesian Optimisationcontinuous-control	—Unverified	0
Bridging the gap between Markowitz planning and deep reinforcement learning	Sep 30, 2020	Asset ManagementAutonomous Driving	—Unverified	0
Neural Lyapunov Model Predictive Control	Sep 28, 2020	continuous-controlContinuous Control	—Unverified	0
Adaptive Discretization for Continuous Control using Particle Filtering Policy Network	Sep 28, 2020	continuous-controlContinuous Control	—Unverified	0
What About Taking Policy as Input of Value Function: Policy-extended Value Function Approximator	Sep 28, 2020	continuous-controlContinuous Control	—Unverified	0
Autonomous Learning of Features for Control: Experiments with Embodied and Situated Agents	Sep 15, 2020	continuous-controlContinuous Control	—Unverified	0
Multi-Agent Reinforcement Learning in Cournot Games	Sep 14, 2020	continuous-controlContinuous Control	—Unverified	0
DyNODE: Neural Ordinary Differential Equations for Dynamics Modeling in Continuous Control	Sep 9, 2020	continuous-controlContinuous Control	CodeCode Available	1
Visualizing the Loss Landscape of Actor Critic Methods with Applications in Inventory Optimization	Sep 4, 2020	continuous-controlContinuous Control	—Unverified	0
On the model-based stochastic value gradient for continuous reinforcement learning	Aug 28, 2020	Continuous ControlHumanoid Control	CodeCode Available	1
Learning Off-Policy with Online Planning	Aug 23, 2020	ARCContinuous Control	CodeCode Available	1
ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for Mobile Manipulation	Aug 18, 2020	continuous-controlContinuous Control	—Unverified	0
Overcoming Model Bias for Robust Offline Deep Reinforcement Learning	Aug 12, 2020	continuous-controlContinuous Control	—Unverified	0
Contrastive Variational Reinforcement Learning for Complex Observations	Aug 6, 2020	Atari GamesContinuous Control	CodeCode Available	1
ClipUp: A Simple and Powerful Optimizer for Distribution-based Policy Evolution	Aug 5, 2020	continuous-controlContinuous Control	CodeCode Available	1
Proximal Deterministic Policy Gradient	Aug 3, 2020	continuous-controlContinuous Control	—Unverified	0
Statistical Bootstrapping for Uncertainty Estimation in Off-Policy Evaluation	Jul 27, 2020	continuous-controlContinuous Control	—Unverified	0
Learning Compositional Neural Programs for Continuous Control	Jul 27, 2020	continuous-controlContinuous Control	—Unverified	0
Predictive Information Accelerates Learning in RL	Jul 24, 2020	continuous-controlContinuous Control	CodeCode Available	1
Understanding and Mitigating the Limitations of Prioritized Experience Replay	Jul 19, 2020	Autonomous Drivingcontinuous-control	CodeCode Available	0
Control as Hybrid Inference	Jul 11, 2020	continuous-controlContinuous Control	—Unverified	0
Task-Agnostic Exploration via Policy Gradient of a Non-Parametric State Entropy Estimate	Jul 9, 2020	continuous-controlContinuous Control	CodeCode Available	1
Lipschitzness Is All You Need To Tame Off-policy Generative Adversarial Imitation Learning	Jun 28, 2020	AllContinuous Control	CodeCode Available	0
Deep Bayesian Quadrature Policy Optimization	Jun 28, 2020	continuous-controlContinuous Control	CodeCode Available	1
DDPG++: Striving for Simplicity in Continuous-control Off-Policy Reinforcement Learning	Jun 26, 2020	continuous-controlContinuous Control	—Unverified	0
Off-Dynamics Reinforcement Learning: Training for Transfer with Domain Classifiers	Jun 24, 2020	continuous-controlContinuous Control	CodeCode Available	0
dm_control: Software and Tasks for Continuous Control	Jun 22, 2020	continuous-controlContinuous Control	—Unverified	0
Information Theoretic Regret Bounds for Online Nonlinear Control	Jun 22, 2020	continuous-controlContinuous Control	CodeCode Available	0
Towards Tractable Optimism in Model-Based Reinforcement Learning	Jun 21, 2020	continuous-controlContinuous Control	—Unverified	0
Generating Adjacency-Constrained Subgoals in Hierarchical Reinforcement Learning	Jun 20, 2020	continuous-controlContinuous Control	CodeCode Available	1
WD3: Taming the Estimation Bias in Deep Reinforcement Learning	Jun 18, 2020	continuous-controlContinuous Control	—Unverified	0
Reparameterized Variational Divergence Minimization for Stable Imitation	Jun 18, 2020	continuous-controlContinuous Control	—Unverified	0
COLREG-Compliant Collision Avoidance for Unmanned Surface Vehicle using Deep Reinforcement Learning	Jun 16, 2020	Autonomous VehiclesCollision Avoidance	—Unverified	0
Data Driven Control with Learned Dynamics: Model-Based versus Model-Free Approach	Jun 16, 2020	continuous-controlContinuous Control	—Unverified	0
Parameter-Based Value Functions	Jun 16, 2020	continuous-controlContinuous Control	CodeCode Available	0
Model-based Adversarial Meta-Reinforcement Learning	Jun 16, 2020	continuous-controlContinuous Control	CodeCode Available	1
Analytic Manifold Learning: Unifying and Evaluating Representations for Continuous Control	Jun 15, 2020	continuous-controlContinuous Control	CodeCode Available	1
Diversity Policy Gradient for Sample Efficient Quality-Diversity Optimization	Jun 15, 2020	continuous-controlContinuous Control	—Unverified	0
Provably Efficient Model-based Policy Adaptation	Jun 14, 2020	continuous-controlContinuous Control	—Unverified	0
Online Hyper-parameter Tuning in Off-policy Learning via Evolutionary Strategies	Jun 13, 2020	continuous-controlContinuous Control	—Unverified	0
Lifelong Learning of Factored Policies via Policy Gradients	Jun 12, 2020	continuous-controlContinuous Control	—Unverified	0
Skill Discovery for Exploration and Planning using Deep Skill Graphs	Jun 12, 2020	continuous-controlContinuous Control	—Unverified	0
A Policy Gradient Method for Task-Agnostic Exploration	Jun 12, 2020	continuous-controlContinuous Control	CodeCode Available	1
Self-Imitation Learning via Generalized Lower Bound Q-learning	Jun 12, 2020	continuous-controlContinuous Control	—Unverified	0
Continuous Control for Searching and Planning with a Learned Model	Jun 12, 2020	continuous-controlContinuous Control	—Unverified	0

Show:10 25 50

← PrevPage 16 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified