Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 1161 papers

Title	Date	Tasks	Status
Exploring More When It Needs in Deep Reinforcement Learning	Sep 28, 2021	continuous-controlContinuous Control	—Unverified
Exploring Pessimism and Optimism Dynamics in Deep Reinforcement Learning	Jun 6, 2024	continuous-controlContinuous Control	—Unverified
Imitation-Projected Programmatic Reinforcement Learning	Jul 11, 2019	continuous-controlContinuous Control	—Unverified
FaceDirector: Continuous Control of Facial Performance in Video	Dec 1, 2015	Audio-Visual Synchronizationcontinuous-control	—Unverified
Factored Action Spaces in Deep Reinforcement Learning	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Faster Reinforcement Learning with Value Target Lower Bounding	Sep 29, 2021	Atari Gamescontinuous-control	—Unverified
Combining Model-based and Model-free RL via Multi-step Control Variates	Jan 1, 2018	continuous-controlContinuous Control	—Unverified
Combine PPO with NES to Improve Exploration	May 23, 2019	continuous-controlContinuous Control	—Unverified
DynaMITE-RL: A Dynamic Model for Improved Temporal Meta-Reinforcement Learning	Feb 25, 2024	continuous-controlContinuous Control	—Unverified
Aggressive Q-Learning with Ensembles: Achieving Both High Sample Efficiency and High Asymptotic Performance	Nov 17, 2021	continuous-controlContinuous Control	—Unverified
IMPACT: Importance Weighted Asynchronous Architectures with Clipped Target Networks	Nov 30, 2019	continuous-controlContinuous Control	—Unverified
Fight fire with fire: countering bad shortcuts in imitation learning with good shortcuts	Sep 29, 2021	Autonomous Drivingcontinuous-control	—Unverified
COLREG-Compliant Collision Avoidance for Unmanned Surface Vehicle using Deep Reinforcement Learning	Jun 16, 2020	Autonomous VehiclesCollision Avoidance	—Unverified
Fighting Fire with Fire: Avoiding DNN Shortcuts through Priming	Jun 22, 2022	Autonomous DrivingClassification	—Unverified
Fingerprint Policy Optimisation for Robust Reinforcement Learning	May 27, 2018	Bayesian OptimisationContinuous Control	—Unverified
Finite-time Analysis of Approximate Policy Iteration for the Linear Quadratic Regulator	May 30, 2019	continuous-controlContinuous Control	—Unverified
Dynamic Modeling and Control for an Offshore Semisubmersible Floating Wind Turbine	Jun 17, 2024	continuous-controlContinuous Control	—Unverified
First Go, then Post-Explore: the Benefits of Post-Exploration in Intrinsic Motivation	Dec 6, 2022	continuous-controlContinuous Control	—Unverified
A Bayesian Approach to Generative Adversarial Imitation Learning	Dec 1, 2018	continuous-controlContinuous Control	—Unverified
Keyframe-Focused Visual Imitation Learning	Jun 11, 2021	continuous-controlContinuous Control	—Unverified
Continuous Neural Algorithmic Planners	Nov 29, 2022	continuous-controlContinuous Control	—Unverified
Imitation Learning from Observation through Optimal Transport	Oct 2, 2023	continuous-controlContinuous Control	—Unverified
Dynamic Exploitation Gaussian Bare-Bones Bat Algorithm for Optimal Reactive Power Dispatch to Improve the Safety and Stability of Power System	Dec 13, 2021	continuous-controlContinuous Control	—Unverified
A Game Theoretic Perspective on Model-Based Reinforcement Learning	Jan 1, 2020	continuous-controlContinuous Control	—Unverified
Fully Distributed Actor-Critic Architecture for Multitask Deep Reinforcement Learning	Oct 23, 2021	continuous-controlContinuous Control	—Unverified
Game-Theoretic Robust Reinforcement Learning Handles Temporally-Coupled Perturbations	Jul 22, 2023	continuous-controlContinuous Control	—Unverified
Imitation Learning from Pixel Observations for Continuous Control	Sep 29, 2021	Benchmarkingcontinuous-control	—Unverified
Dual Policy Iteration	May 28, 2018	continuous-controlContinuous Control	—Unverified
Uncertainty Estimation Using Riemannian Model~Dynamics for Offline Reinforcement Learning	Feb 22, 2021	Autonomous Drivingcontinuous-control	—Unverified
GEM: Group Enhanced Model for Learning Dynamical Control Systems	Apr 7, 2021	continuous-controlContinuous Control	—Unverified
Imitation from Diverse Behaviors: Wasserstein Quality Diversity Imitation Learning with Single-Step Archive Exploration	Nov 11, 2024	continuous-controlContinuous Control	—Unverified
Adaptive Discretization for Continuous Control using Particle Filtering Policy Network	Sep 28, 2020	continuous-controlContinuous Control	—Unverified
Contrastive Value Learning: Implicit Models for Simple Offline RL	Nov 3, 2022	continuous-controlContinuous Control	—Unverified
Generalization in Transfer Learning	Sep 3, 2019	continuous-controlContinuous Control	—Unverified
Imitation Learning As State Matching via Differentiable Physics	Jan 1, 2023	continuous-controlContinuous Control	—Unverified
Implicit Safe Set Algorithm for Provably Safe Reinforcement Learning	May 4, 2024	continuous-controlContinuous Control	—Unverified
CoachNet: An Adversarial Sampling Approach for Reinforcement Learning	Jan 7, 2021	continuous-controlContinuous Control	—Unverified
Dream to Explore: Adaptive Simulations for Autonomous Systems	Oct 27, 2021	continuous-controlContinuous Control	—Unverified
Wasserstein Barycenter Soft Actor-Critic	Jun 11, 2025	continuous-controlContinuous Control	—Unverified
Generalizing Successor Features to continuous domains for Multi-task Learning	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
Image-Based Deep Reinforcement Learning with Intrinsically Motivated Stimuli: On the Execution of Complex Robotic Tasks	Jul 31, 2024	continuous-controlContinuous Control	—Unverified
Dragin3D: Image Editing by Dragging in 3D Space	Jan 1, 2025	3D Object Reconstructioncontinuous-control	—Unverified
Doubly Stochastic Adversarial Autoencoder	Jul 19, 2018	continuous-controlContinuous Control	—Unverified
Genetic Soft Updates for Policy Evolution in Deep Reinforcement Learning	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Global Convergence of Direct Policy Search for State-Feedback H_ Robust Control: A Revisit of Nonsmooth Synthesis with Goldstein Subdifferential	Oct 20, 2022	continuous-controlContinuous Control	—Unverified
Global Convergence of Policy Gradient Methods for the Linear Quadratic Regulator	Jan 15, 2018	continuous-controlContinuous Control	—Unverified
Clustered Reinforcement Learning	Jun 6, 2019	Atari GamesClustering	—Unverified
Doubly Robust Off-Policy Actor-Critic Algorithms for Reinforcement Learning	Dec 11, 2019	continuous-controlContinuous Control	—Unverified
Cooperative guidance of multiple missiles: a hybrid co-evolutionary approach	Aug 15, 2022	continuous-controlContinuous Control	—Unverified
Double Actor-Critic with TD Error-Driven Regularization in Reinforcement Learning	Sep 28, 2024	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 9 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified