Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 1161 papers

Title	Date	Tasks	Status
Safe Policy Learning for Continuous Control	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
A Q-learning approach to the continuous control problem of robot inverted pendulum balancing	Dec 5, 2023	continuous-controlContinuous Control	—Unverified
Value-Based Reinforcement Learning for Continuous Control Robotic Manipulation in Multi-Task Sparse Reward Settings	Jul 28, 2021	continuous-controlContinuous Control	—Unverified
Safe Reinforcement Learning using Data-Driven Predictive Control	Nov 20, 2022	continuous-controlContinuous Control	—Unverified
Safe Reinforcement Learning with Dead-Ends Avoidance and Recovery	Jun 24, 2023	continuous-controlContinuous Control	—Unverified
SA-MATD3:Self-attention-based multi-agent continuous control method in cooperative environments	Jul 1, 2021	continuous-controlContinuous Control	—Unverified
Multiagent Model-based Credit Assignment for Continuous Control	Dec 27, 2021	continuous-controlContinuous Control	—Unverified
A Prototype of Reconfigurable Intelligent Surface with Continuous Control of the Reflection Phase	May 25, 2021	continuous-controlContinuous Control	—Unverified
Approximate Equivariance in Reinforcement Learning	Nov 6, 2024	continuous-controlContinuous Control	—Unverified
Sample Efficient Imitation Learning for Continuous Control	May 1, 2019	continuous-controlContinuous Control	—Unverified
Value function estimation using conditional diffusion models for control	Jun 9, 2023	continuous-controlContinuous Control	—Unverified
Depth-CUPRL: Depth-Imaged Contrastive Unsupervised Prioritized Representations in Reinforcement Learning for Mapless Navigation of Unmanned Aerial Vehicles	Jun 30, 2022	continuous-controlContinuous Control	—Unverified
Derivative-Free Policy Optimization for Linear Risk-Sensitive and Robust Control Design: Implicit Regularization and Sample Complexity	Jan 4, 2021	continuous-controlContinuous Control	—Unverified
Detecting Cyberattacks in Industrial Control Systems Using Online Learning Algorithms	Dec 8, 2019	continuous-controlContinuous Control	—Unverified
Deterministic Policy Gradient Primal-Dual Methods for Continuous-Space Constrained MDPs	Aug 19, 2024	continuous-controlContinuous Control	—Unverified
Deterministic Policy Gradients With General State Transitions	Jul 10, 2018	continuous-controlContinuous Control	—Unverified
Deterministic Policy Imitation Gradient Algorithm	Jan 1, 2018	continuous-controlContinuous Control	—Unverified
Deterministic Value-Policy Gradients	Sep 9, 2019	continuous-controlContinuous Control	—Unverified
Sample efficient Quality Diversity for neural continuous control	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Diagnosis, Feedback, Adaptation: A Human-in-the-Loop Framework for Test-Time Policy Adaptation	Jul 12, 2023	continuous-controlContinuous Control	—Unverified
Differentially Private Deep Model-Based Reinforcement Learning	Feb 8, 2024	continuous-controlContinuous Control	—Unverified
Dense Dynamics-Aware Reward Synthesis: Integrating Prior Experience with Demonstrations	Dec 2, 2024	continuous-controlContinuous Control	—Unverified
Demystifying the Physics of Deep Reinforcement Learning-Based Autonomous Vehicle Decision-Making	Mar 18, 2024	Autonomous Vehiclescontinuous-control	—Unverified
Diffusion Imitation from Observation	Oct 7, 2024	continuous-controlContinuous Control	—Unverified
Diffusion Model-Augmented Behavioral Cloning	Feb 26, 2023	continuous-controlContinuous Control	—Unverified
Diffusion Policies for Out-of-Distribution Generalization in Offline Reinforcement Learning	Jul 10, 2023	continuous-controlContinuous Control	—Unverified
Fuzzy Tiling Activations: A Simple Approach to Learning Sparse Representations Online	Nov 19, 2019	Continual Learningcontinuous-control	—Unverified
DeepThermal: Combustion Optimization for Thermal Power Generating Units Using Offline Reinforcement Learning	Feb 23, 2021	Continuous ControlOffline RL	—Unverified
Deep RL With Information Constrained Policies: Generalization in Continuous Control	Oct 9, 2020	continuous-controlContinuous Control	—Unverified
Deep Reinforcement Learning with Surrogate Agent-Environment Interface	Sep 12, 2017	continuous-controlContinuous Control	—Unverified
World Models as Reference Trajectories for Rapid Motor Adaptation	May 21, 2025	continuous-controlContinuous Control	—Unverified
Deep Reinforcement Learning With Adaptive Combined Critics	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Deep Radial-Basis Value Functions for Continuous Control	Feb 5, 2020	continuous-controlContinuous Control	—Unverified
LTL-Constrained Policy Optimization with Cycle Experience Replay	Apr 17, 2024	continuous-controlContinuous Control	—Unverified
Discrete Sequential Prediction of Continuous Actions for Deep RL	May 14, 2017	continuous-controlContinuous Control	—Unverified
Sample-efficient reinforcement learning using deep Gaussian processes	Nov 2, 2020	continuous-controlContinuous Control	—Unverified
Twin actor twin delayed deep deterministic policy gradient (TATD3) learning for batch process control	Feb 25, 2021	continuous-controlContinuous Control	—Unverified
Disentangling Dynamics and Returns: Value Function Decomposition with Future Prediction	May 27, 2019	continuous-controlContinuous Control	—Unverified
Disentangling Transfer in Continual Reinforcement Learning	Sep 28, 2022	Continual Learningcontinuous-control	—Unverified
Distributed Safe Control Design and Probabilistic Safety Verification for Multi-Agent Systems	Mar 22, 2023	Collision AvoidanceContinuous Control	—Unverified
Sample-Efficient Reinforcement Learning with Stochastic Ensemble Value Expansion	Jul 4, 2018	continuous-controlContinuous Control	—Unverified
Distributional Actor-Critic Ensemble for Uncertainty-Aware Continuous Control	Jul 27, 2022	continuous-controlContinuous Control	—Unverified
Distributional Decision Transformer for Hindsight Information Matching	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
Distributionally Robust Reinforcement Learning	Feb 23, 2019	continuous-controlContinuous Control	—Unverified
Deep Intrinsically Motivated Continuous Actor-Critic for Efficient Robotic Visuomotor Skill Learning	Oct 26, 2018	continuous-controlContinuous Control	—Unverified
Distributional Reinforcement Learning with Dual Expectile-Quantile Regression	May 26, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified
DSAC: Distributional Soft Actor Critic for Risk-Sensitive Reinforcement Learning	Apr 30, 2020	continuous-controlContinuous Control	—Unverified
Dive into the Power of Neuronal Heterogeneity	May 19, 2023	continuous-controlContinuous Control	—Unverified
Sample Efficient Robot Learning with Structured World Models	Oct 21, 2022	continuous-controlContinuous Control	—Unverified
Sample-Optimal Zero-Violation Safety For Continuous Control	Mar 9, 2024	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 20 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified