Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 1161 papers

Title	Date	Tasks	Status
Multi-step Greedy Policies in Model-Free Deep Reinforcement Learning	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
QXplore: Q-Learning Exploration by Maximizing Temporal Difference Error	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Samples Are Useful? Not Always: denoising policy gradient updates using variance explained	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Learning Functionally Decomposed Hierarchies for Continuous Navigation Tasks	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Policy Optimization In the Face of Uncertainty	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Estimators for Reinforcement Learning	Sep 23, 2019	continuous-controlContinuous Control	CodeCode Available
How Much Do Unstated Problem Constraints Limit Deep Robotic Reinforcement Learning?	Sep 20, 2019	continuous-controlContinuous Control	—Unverified
Meta-Inverse Reinforcement Learning with Probabilistic Context Variables	Sep 20, 2019	continuous-controlContinuous Control	CodeCode Available
Attraction-Repulsion Actor-Critic for Continuous Control Reinforcement Learning	Sep 17, 2019	continuous-controlContinuous Control	—Unverified
Policy Prediction Network: Model-Free Behavior Policy with Model-Based Learning in Continuous Action Space	Sep 15, 2019	continuous-controlContinuous Control	—Unverified
Biased Estimates of Advantages over Path Ensembles	Sep 15, 2019	Atari Gamescontinuous-control	—Unverified
Driving in Dense Traffic with Model-Free Reinforcement Learning	Sep 15, 2019	continuous-controlContinuous Control	CodeCode Available
VILD: Variational Imitation Learning with Diverse-quality Demonstrations	Sep 15, 2019	continuous-controlContinuous Control	—Unverified
Deterministic Value-Policy Gradients	Sep 9, 2019	continuous-controlContinuous Control	—Unverified
Learning Action-Transferable Policy with Action Embedding	Sep 5, 2019	Continuous ControlReinforcement Learning	CodeCode Available
Generalization in Transfer Learning	Sep 3, 2019	continuous-controlContinuous Control	—Unverified
Dynamics-aware Embeddings	Aug 25, 2019	continuous-controlContinuous Control	CodeCode Available
Model-based Lookahead Reinforcement Learning	Aug 15, 2019	continuous-controlContinuous Control	—Unverified
Continuous Control for High-Dimensional State Spaces: An Interactive Learning Approach	Aug 14, 2019	continuous-controlContinuous Control	—Unverified
Inverse Rational Control with Partially Observable Continuous Nonlinear Dynamics	Aug 13, 2019	continuous-controlContinuous Control	—Unverified
Promoting Coordination through Policy Regularization in Multi-Agent Deep Reinforcement Learning	Aug 6, 2019	continuous-controlContinuous Control	—Unverified
Neural Simplex Architecture	Aug 1, 2019	continuous-controlContinuous Control	—Unverified
Learning Stabilizable Nonlinear Dynamics with Contraction-Based Regularization	Jul 29, 2019	continuous-controlContinuous Control	CodeCode Available
A Model-based Approach for Sample-efficient Multi-task Reinforcement Learning	Jul 11, 2019	continuous-controlContinuous Control	—Unverified
Imitation-Projected Programmatic Reinforcement Learning	Jul 11, 2019	continuous-controlContinuous Control	—Unverified
On-Policy Robot Imitation Learning from a Converging Supervisor	Jul 8, 2019	continuous-controlContinuous Control	—Unverified
On Inductive Biases in Deep Reinforcement Learning	Jul 5, 2019	continuous-controlContinuous Control	—Unverified
Co-training for Policy Learning	Jul 3, 2019	Combinatorial Optimizationcontinuous-control	CodeCode Available
Stochastic Latent Actor-Critic: Deep Reinforcement Learning with a Latent Variable Model	Jul 1, 2019	continuous-controlContinuous Control	CodeCode Available
FiDi-RL: Incorporating Deep Reinforcement Learning with Finite-Difference Policy Search for Efficient Learning of Continuous Control	Jul 1, 2019	continuous-controlContinuous Control	—Unverified
Policy Optimization with Stochastic Mirror Descent	Jun 25, 2019	Continuous ControlPolicy Gradient Methods	—Unverified
Uncertainty-aware Model-based Policy Optimization	Jun 25, 2019	continuous-controlContinuous Control	—Unverified
Learning Belief Representations for Imitation Learning in POMDPs	Jun 22, 2019	continuous-controlContinuous Control	CodeCode Available
Continual Reinforcement Learning with Diversity Exploration and Adversarial Self-Correction	Jun 21, 2019	Autonomous Drivingcontinuous-control	—Unverified
Max-Plus Matching Pursuit for Deterministic Markov Decision Processes	Jun 20, 2019	continuous-controlContinuous Control	—Unverified
Experience Replay Optimization	Jun 19, 2019	continuous-controlContinuous Control	—Unverified
Reward Prediction Error as an Exploration Objective in Deep RL	Jun 19, 2019	Atari GamesContinuous Control	—Unverified
Unsupervised Learning of Object Structure and Dynamics from Videos	Jun 19, 2019	Action Recognitioncontinuous-control	—Unverified
Robust Reinforcement Learning for Continuous Control with Model Misspecification	Jun 18, 2019	continuous-controlContinuous Control	—Unverified
Conditioning of Reinforcement Learning Agents and its Policy Regularization Application	Jun 13, 2019	continuous-controlContinuous Control	—Unverified
Clustered Reinforcement Learning	Jun 6, 2019	Atari GamesClustering	—Unverified
Continuous Control for Automated Lane Change Behavior Based on Deep Deterministic Policy Gradient Algorithm	Jun 5, 2019	continuous-controlContinuous Control	—Unverified
Stabilizing Off-Policy Q-Learning via Bootstrapping Error Reduction	Jun 3, 2019	continuous-controlContinuous Control	CodeCode Available
Finite-time Analysis of Approximate Policy Iteration for the Linear Quadratic Regulator	May 30, 2019	continuous-controlContinuous Control	—Unverified
Policy Search by Target Distribution Learning for Continuous Control	May 27, 2019	continuous-controlContinuous Control	—Unverified
Disentangling Dynamics and Returns: Value Function Decomposition with Future Prediction	May 27, 2019	continuous-controlContinuous Control	—Unverified
MCP: Learning Composable Hierarchical Control with Multiplicative Compositional Policies	May 23, 2019	continuous-controlContinuous Control	CodeCode Available
Recurrent Value Functions	May 23, 2019	continuous-controlContinuous Control	—Unverified
Combine PPO with NES to Improve Exploration	May 23, 2019	continuous-controlContinuous Control	—Unverified
COBRA: Data-Efficient Model-Based RL through Unsupervised Object Discovery and Curiosity-Driven Exploration	May 22, 2019	continuous-controlContinuous Control	CodeCode Available

Show:10 25 50

← PrevPage 20 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified