Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 1161 papers

Title	Date	Tasks	Status
Overcoming Exploration: Deep Reinforcement Learning for Continuous Control in Cluttered Environments from Temporal Logic Specifications	Jan 28, 2022	continuous-controlContinuous Control	—Unverified
Overcoming Model Bias for Robust Offline Deep Reinforcement Learning	Aug 12, 2020	continuous-controlContinuous Control	—Unverified
Overcoming the Spectral Bias of Neural Value Approximation	Jun 9, 2022	continuous-controlContinuous Control	—Unverified
PACER: A Fully Push-forward-based Distributional Reinforcement Learning Algorithm	Jun 11, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified
Path Integral Networks: End-to-End Differentiable Optimal Control	Jun 29, 2017	continuous-controlContinuous Control	—Unverified
PBCS : Efficient Exploration and Exploitation Using a Synergy between Reinforcement Learning and Motion Planning	Apr 24, 2020	continuous-controlContinuous Control	—Unverified
Photonic Quantum Policy Learning in OpenAI Gym	Aug 29, 2021	BIG-bench Machine Learningcontinuous-control	—Unverified
PlaNet of the Bayesians: Reconsidering and Improving Deep Planning Network by Incorporating Bayesian Inference	Mar 1, 2020	Bayesian Inferencecontinuous-control	—Unverified
Planning and Control of Uncertain Cooperative Mobile Manipulator-Endowed Systems under Temporal-Logic Tasks	Mar 2, 2023	continuous-controlContinuous Control	—Unverified
Planning to Go Out-of-Distribution in Offline-to-Online Reinforcement Learning	Oct 9, 2023	continuous-controlContinuous Control	—Unverified
Planning with Exploration: Addressing Dynamics Bottleneck in Model-based Reinforcement Learning	Oct 24, 2020	continuous-controlContinuous Control	—Unverified
Policy-labeled Preference Learning: Is Preference Enough for RLHF?	May 6, 2025	continuous-controlContinuous Control	—Unverified
Policy Learning and Evaluation with Randomized Quasi-Monte Carlo	Feb 16, 2022	continuous-controlContinuous Control	—Unverified
Policy Manifold Search: Exploring the Manifold Hypothesis for Diversity-based Neuroevolution	Apr 27, 2021	continuous-controlContinuous Control	—Unverified
Policy Manifold Search for Improving Diversity-based Neuroevolution	Dec 15, 2020	continuous-controlContinuous Control	—Unverified
Policy Optimization as Online Learning with Mediator Feedback	Dec 15, 2020	continuous-controlContinuous Control	—Unverified
Policy Optimization In the Face of Uncertainty	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Policy Optimization with Stochastic Mirror Descent	Jun 25, 2019	Continuous ControlPolicy Gradient Methods	—Unverified
Policy Prediction Network: Model-Free Behavior Policy with Model-Based Learning in Continuous Action Space	Sep 15, 2019	continuous-controlContinuous Control	—Unverified
Policy Search by Target Distribution Learning for Continuous Control	May 27, 2019	continuous-controlContinuous Control	—Unverified
Posterior Coreset Construction with Kernelized Stein Discrepancy for Model-Based Reinforcement Learning	Jun 2, 2022	continuous-controlContinuous Control	—Unverified
PottsMGNet: A Mathematical Explanation of Encoder-Decoder Based Neural Networks	Jul 18, 2023	continuous-controlContinuous Control	—Unverified
PPO-UE: Proximal Policy Optimization via Uncertainty-Aware Exploration	Dec 13, 2022	continuous-controlContinuous Control	—Unverified
PreciseControl: Enhancing Text-To-Image Diffusion Models with Fine-Grained Attribute Control	Jul 24, 2024	Attributecontinuous-control	—Unverified
Predicting Dense and Context-aware Cost Maps for Semantic Robot Navigation	Oct 17, 2022	continuous-controlContinuous Control	—Unverified
Predicting Multiple Actions for Stochastic Continuous Control	Jan 1, 2018	continuous-controlContinuous Control	—Unverified
A Strategy for Preparing Quantum Squeezed States Using Reinforcement Learning	Jan 29, 2024	continuous-controlContinuous Control	—Unverified
Deep Exploration with PAC-Bayes	Feb 5, 2024	continuous-controlContinuous Control	—Unverified
Probabilistic Curriculum Learning for Goal-Based Reinforcement Learning	Apr 2, 2025	continuous-controlContinuous Control	—Unverified
Probabilistic Planning with Sequential Monte Carlo methods	May 1, 2019	continuous-controlContinuous Control	—Unverified
Progressive Reinforcement Learning with Distillation for Multi-Skilled Motion Control	Feb 13, 2018	continuous-controlContinuous Control	—Unverified
Promoting Coordination through Policy Regularization in Multi-Agent Deep Reinforcement Learning	Aug 6, 2019	continuous-controlContinuous Control	—Unverified
Promoting Stochasticity for Expressive Policies via a Simple and Efficient Regularization Method	Dec 1, 2020	continuous-controlContinuous Control	—Unverified
Provably Convergent Policy Optimization via Metric-aware Trust Region Methods	Jun 25, 2023	continuous-controlContinuous Control	—Unverified
Provably Efficient Convergence of Primal-Dual Actor-Critic with Nonlinear Function Approximation	Feb 28, 2022	continuous-controlContinuous Control	—Unverified
Provably Efficient Model-based Policy Adaptation	Jun 14, 2020	continuous-controlContinuous Control	—Unverified
Proximal Deterministic Policy Gradient	Aug 3, 2020	continuous-controlContinuous Control	—Unverified
Proximal Policy Optimization Smoothed Algorithm	Dec 4, 2020	continuous-controlContinuous Control	—Unverified
Proximal Policy Optimization via Enhanced Exploration Efficiency	Nov 11, 2020	continuous-controlContinuous Control	—Unverified
Proximal Policy Optimization with Continuous Bounded Action Space via the Beta Distribution	Nov 3, 2021	continuous-controlContinuous Control	—Unverified
Proxy Target: Bridging the Gap Between Discrete Spiking Neural Networks and Continuous Control	May 30, 2025	continuous-controlContinuous Control	—Unverified
Pulse Width Modulation Method Applied to Nonlinear Model Predictive Control on an Under-actuated Small Satellite	Jan 21, 2024	continuous-controlContinuous Control	—Unverified
PWM: Policy Learning with Multi-Task World Models	Jul 2, 2024	continuous-controlContinuous Control	—Unverified
QDax: A Library for Quality-Diversity and Population-based Algorithms with Hardware Acceleration	Aug 7, 2023	continuous-controlContinuous Control	—Unverified
Diversity Policy Gradient for Sample Efficient Quality-Diversity Optimization	Jun 15, 2020	continuous-controlContinuous Control	—Unverified
Q-Learning in enormous action spaces via amortized approximate maximization	Jan 22, 2020	continuous-controlContinuous Control	—Unverified
QT-TDM: Planning With Transformer Dynamics Model and Autoregressive Q-Learning	Jul 26, 2024	continuous-controlContinuous Control	—Unverified
Quadratic Programming for Continuous Control of Safety-Critical Multi-Agent Systems Under Uncertainty	Nov 30, 2022	Collision Avoidancecontinuous-control	—Unverified
Quadratic Q-network for Learning Continuous Control for Autonomous Vehicles	Nov 29, 2019	Autonomous DrivingAutonomous Vehicles	—Unverified
Quality Diversity Imitation Learning	Oct 8, 2024	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 12 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified