Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 1161 papers

Title	Date	Tasks	Status
Quantum Observables for continuous control of the Quantum Approximate Optimization Algorithm via Reinforcement Learning	Nov 21, 2019	continuous-controlContinuous Control	—Unverified
Quasimetric Value Functions with Dense Rewards	Sep 13, 2024	continuous-controlContinuous Control	—Unverified
Quasi-Newton Trust Region Policy Optimization	Dec 26, 2019	continuous-controlContinuous Control	—Unverified
Reward Prediction Error as an Exploration Objective in Deep RL	Jun 19, 2019	Atari GamesContinuous Control	—Unverified
QXplore: Q-Learning Exploration by Maximizing Temporal Difference Error	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Ready Policy One: World Building Through Active Learning	Feb 7, 2020	Active Learningcontinuous-control	—Unverified
Real-time interactive sequence generation and control with Recurrent Neural Network ensembles	Dec 14, 2016	continuous-controlContinuous Control	—Unverified
Real-Time Model-Free Deep Reinforcement Learning for Force Control of a Series Elastic Actuator	Apr 11, 2023	continuous-controlContinuous Control	—Unverified
Real-Time Recurrent Reinforcement Learning	Nov 8, 2023	continuous-controlContinuous Control	—Unverified
REBEL: Reward Regularization-Based Approach for Robotic Reinforcement Learning from Human Feedback	Dec 22, 2023	Bilevel Optimizationcontinuous-control	—Unverified
Recruitment-imitation Mechanism for Evolutionary Reinforcement Learning	Dec 13, 2019	continuous-controlContinuous Control	—Unverified
Recurrent Value Functions	May 23, 2019	continuous-controlContinuous Control	—Unverified
Recursive Least Squares Advantage Actor-Critic Algorithms	Jan 15, 2022	Computational Efficiencycontinuous-control	—Unverified
WD3: Taming the Estimation Bias in Deep Reinforcement Learning	Jun 18, 2020	continuous-controlContinuous Control	—Unverified
Refined Continuous Control of DDPG Actors via Parametrised Activation	Jun 4, 2020	continuous-controlContinuous Control	—Unverified
Regularized Soft Actor-Critic for Behavior Transfer Learning	Sep 27, 2022	continuous-controlContinuous Control	—Unverified
Regularizing Model-Based Planning with Energy-Based Models	Oct 12, 2019	continuous-controlContinuous Control	—Unverified
Regulatory Focus: Promotion and Prevention Inclinations in Policy Search	Sep 25, 2019	Atari Gamescontinuous-control	—Unverified
Reinforcement Learning Control of Constrained Dynamic Systems with Uniformly Ultimate Boundedness Stability Guarantee	Nov 13, 2020	continuous-controlContinuous Control	—Unverified
Reinforcement Learning for Control with Multiple Frequencies	Dec 1, 2020	continuous-controlContinuous Control	—Unverified
Reinforcement Learning for Many-Body Ground-State Preparation Inspired by Counterdiabatic Driving	Oct 7, 2020	continuous-controlContinuous Control	—Unverified
Reinforcement Learning Tracking Control for Robotic Manipulator With Kernel-Based Dynamic Model	Jan 9, 2020	continuous-controlContinuous Control	—Unverified
Reinforcement Learning via Implicit Imitation Guidance	Jun 9, 2025	continuous-controlContinuous Control	—Unverified
Reinforcement Learning with Partial Parametric Model Knowledge	Apr 26, 2023	continuous-controlContinuous Control	—Unverified
Reinforcement Learning with Simple Sequence Priors	May 26, 2023	continuous-controlContinuous Control	—Unverified
Relative Policy-Transition Optimization for Fast Policy Transfer	Jun 13, 2022	continuous-controlContinuous Control	—Unverified
A cGAN Ensemble-based Uncertainty-aware Surrogate Model for Offline Model-based Optimization in Industrial Control Problems	May 15, 2022	continuous-controlContinuous Control	—Unverified
ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for Mobile Manipulation	Aug 18, 2020	continuous-controlContinuous Control	—Unverified
ReLOAD: Reinforcement Learning with Optimistic Ascent-Descent for Last-Iterate Convergence in Constrained MDPs	Feb 2, 2023	continuous-controlContinuous Control	—Unverified
Remember and Forget Experience Replay for Multi-Agent Reinforcement Learning	Mar 24, 2022	continuous-controlContinuous Control	—Unverified
RE-MOVE: An Adaptive Policy Design for Robotic Navigation Tasks in Dynamic Environments via Language-Based Feedback	Mar 14, 2023	continuous-controlContinuous Control	—Unverified
ReNeg and Backseat Driver: Learning from Demonstration with Continuous Human Feedback	Jan 16, 2019	continuous-controlContinuous Control	—Unverified
Reparameterized Variational Divergence Minimization for Stable Imitation	Jun 18, 2020	continuous-controlContinuous Control	—Unverified
Frustratingly Easy Regularization on Representation Can Boost Deep Reinforcement Learning	May 29, 2022	Continuous ControlDeep Reinforcement Learning	—Unverified
Research Advances and New Paradigms for Biology-inspired Spiking Neural Networks	Aug 26, 2024	Automatic Speech RecognitionBrain Computer Interface	—Unverified
Resource-Constrained Station-Keeping for Helium Balloons using Reinforcement Learning	Mar 2, 2023	continuous-controlContinuous Control	—Unverified
Decoupled Exploration and Exploitation Policies for Sample-Efficient Reinforcement Learning	Jan 23, 2021	continuous-controlContinuous Control	—Unverified
Rethinking Optimal Transport in Offline Reinforcement Learning	Oct 17, 2024	continuous-controlContinuous Control	—Unverified
Revisiting Estimation Bias in Policy Gradients for Deep Reinforcement Learning	Jan 20, 2023	continuous-controlContinuous Control	—Unverified
Revisiting Gaussian mixture critics in off-policy reinforcement learning: a sample-based approach	Apr 21, 2022	continuous-controlContinuous Control	—Unverified
Revisiting Peng's Q(λ) for Modern Reinforcement Learning	Feb 27, 2021	continuous-controlContinuous Control	—Unverified
Reward function shape exploration in adversarial imitation learning: an empirical study	Apr 14, 2021	continuous-controlContinuous Control	—Unverified
Reward Prediction Error Prioritisation in Experience Replay: The RPE-PER Method	Jan 30, 2025	continuous-controlContinuous Control	—Unverified
Reward Shifting for Optimistic Exploration and Conservative Exploitation	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
RLIF: Interactive Imitation Learning as Reinforcement Learning	Nov 21, 2023	continuous-controlContinuous Control	—Unverified
RLOC: Neurobiologically Inspired Hierarchical Reinforcement Learning Algorithm for Continuous Control of Nonlinear Dynamical Systems	Mar 7, 2019	continuous-controlContinuous Control	—Unverified
Robust Constrained Reinforcement Learning for Continuous Control with Model Misspecification	Oct 20, 2020	continuous-controlContinuous Control	—Unverified
Robust Domain Randomised Reinforcement Learning through Peer-to-Peer Distillation	Dec 9, 2020	continuous-controlContinuous Control	—Unverified
Robust Dynamic Bus Control: A Distributional Multi-agent Reinforcement Learning Approach	Nov 2, 2021	continuous-controlContinuous Control	—Unverified
Robust Imitation Learning from Corrupted Demonstrations	Jan 29, 2022	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 13 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified