Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 1161 papers

Title	Date	Tasks	Status
Remember and Forget Experience Replay for Multi-Agent Reinforcement Learning	Mar 24, 2022	continuous-controlContinuous Control	—Unverified
RE-MOVE: An Adaptive Policy Design for Robotic Navigation Tasks in Dynamic Environments via Language-Based Feedback	Mar 14, 2023	continuous-controlContinuous Control	—Unverified
ReNeg and Backseat Driver: Learning from Demonstration with Continuous Human Feedback	Jan 16, 2019	continuous-controlContinuous Control	—Unverified
Reparameterized Variational Divergence Minimization for Stable Imitation	Jun 18, 2020	continuous-controlContinuous Control	—Unverified
Frustratingly Easy Regularization on Representation Can Boost Deep Reinforcement Learning	May 29, 2022	Continuous ControlDeep Reinforcement Learning	—Unverified
Where Off-Policy Deep Reinforcement Learning Fails	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
Research Advances and New Paradigms for Biology-inspired Spiking Neural Networks	Aug 26, 2024	Automatic Speech RecognitionBrain Computer Interface	—Unverified
Resource-Constrained Station-Keeping for Helium Balloons using Reinforcement Learning	Mar 2, 2023	continuous-controlContinuous Control	—Unverified
Decoupled Exploration and Exploitation Policies for Sample-Efficient Reinforcement Learning	Jan 23, 2021	continuous-controlContinuous Control	—Unverified
Rethinking Optimal Transport in Offline Reinforcement Learning	Oct 17, 2024	continuous-controlContinuous Control	—Unverified
Revisiting Estimation Bias in Policy Gradients for Deep Reinforcement Learning	Jan 20, 2023	continuous-controlContinuous Control	—Unverified
Revisiting Gaussian mixture critics in off-policy reinforcement learning: a sample-based approach	Apr 21, 2022	continuous-controlContinuous Control	—Unverified
Revisiting Peng's Q(λ) for Modern Reinforcement Learning	Feb 27, 2021	continuous-controlContinuous Control	—Unverified
Reward function shape exploration in adversarial imitation learning: an empirical study	Apr 14, 2021	continuous-controlContinuous Control	—Unverified
Reward Prediction Error Prioritisation in Experience Replay: The RPE-PER Method	Jan 30, 2025	continuous-controlContinuous Control	—Unverified
Reward Shifting for Optimistic Exploration and Conservative Exploitation	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
Understanding the Relation Between Maximum-Entropy Inverse Reinforcement Learning and Behaviour Cloning	Mar 27, 2019	continuous-controlContinuous Control	—Unverified
Attraction-Repulsion Actor-Critic for Continuous Control Reinforcement Learning	Sep 17, 2019	continuous-controlContinuous Control	—Unverified
RLIF: Interactive Imitation Learning as Reinforcement Learning	Nov 21, 2023	continuous-controlContinuous Control	—Unverified
RLOC: Neurobiologically Inspired Hierarchical Reinforcement Learning Algorithm for Continuous Control of Nonlinear Dynamical Systems	Mar 7, 2019	continuous-controlContinuous Control	—Unverified
Attitude Control of Highly Maneuverable Aircraft Using an Improved Q-learning	Oct 22, 2022	continuous-controlContinuous Control	—Unverified
Understanding What Affects the Generalization Gap in Visual Reinforcement Learning: Theory and Empirical Evidence	Feb 5, 2024	continuous-controlContinuous Control	—Unverified
A Surrogate-Assisted Controller for Expensive Evolutionary Reinforcement Learning	Jan 1, 2022	continuous-controlContinuous Control	—Unverified
Robust Constrained Reinforcement Learning for Continuous Control with Model Misspecification	Oct 20, 2020	continuous-controlContinuous Control	—Unverified
Uniform State Abstraction For Reinforcement Learning	Apr 6, 2020	continuous-controlContinuous Control	—Unverified
Robust Domain Randomised Reinforcement Learning through Peer-to-Peer Distillation	Dec 9, 2020	continuous-controlContinuous Control	—Unverified
Robust Dynamic Bus Control: A Distributional Multi-agent Reinforcement Learning Approach	Nov 2, 2021	continuous-controlContinuous Control	—Unverified
Robust Imitation Learning from Corrupted Demonstrations	Jan 29, 2022	continuous-controlContinuous Control	—Unverified
ACE : Off-Policy Actor-Critic with Causality-Aware Entropy Regularization	Feb 22, 2024	continuous-controlContinuous Control	—Unverified
Robust Imitation of a Few Demonstrations with a Backwards Model	Oct 17, 2022	continuous-controlContinuous Control	—Unverified
Unsupervised Learning of Object Structure and Dynamics from Videos	Jun 19, 2019	Action Recognitioncontinuous-control	—Unverified
Robust Model Predictive Techno-Economic Control of Active Distribution Networks	May 5, 2023	continuous-controlContinuous Control	—Unverified
Robustness to Adversarial Attacks in Learning-Enabled Controllers	Jun 11, 2020	continuous-controlContinuous Control	—Unverified
Robust Offline Reinforcement Learning from Low-Quality Data	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Robust Output Tracking for an Uncertain and Nonlinear 3D PDE-ODE System: Preventing Induced Seismicity in Underground Reservoirs	Dec 9, 2024	continuous-controlContinuous Control	—Unverified
Unsupervised Meta-Testing with Conditional Neural Processes for Hybrid Meta-Reinforcement Learning	Jun 4, 2025	continuous-controlContinuous Control	—Unverified
Zero-Shot Uncertainty-Aware Deployment of Simulation Trained Policies on Real-World Robots	Dec 10, 2021	continuous-controlContinuous Control	—Unverified
Robust Reinforcement Learning for Continuous Control with Model Misspecification	Jun 18, 2019	continuous-controlContinuous Control	—Unverified
ACE: An Actor Ensemble Algorithm for Continuous Control with Tree Search	Nov 6, 2018	continuous-controlContinuous Control	—Unverified
Robust Reinforcement Learning in POMDPs with Incomplete and Noisy Observations	Feb 15, 2019	continuous-controlContinuous Control	—Unverified
A Strong Baseline for Batch Imitation Learning	Feb 6, 2023	continuous-controlContinuous Control	—Unverified
A Strategy-Oriented Bayesian Soft Actor-Critic Model	Mar 7, 2023	continuous-controlContinuous Control	—Unverified
Using Deep Reinforcement Learning for the Continuous Control of Robotic Arms	Oct 15, 2018	continuous-controlContinuous Control	—Unverified
Why so pessimistic? Estimating uncertainties for offline RL through ensembles, and why their independence matters.	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
rQdia: Regularizing Q-Value Distributions With Image Augmentation	Jun 26, 2025	continuous-controlContinuous Control	—Unverified
ARC -- Actor Residual Critic for Adversarial Imitation Learning	Jun 5, 2022	ARCcontinuous-control	—Unverified
SAAC: Safe Reinforcement Learning as an Adversarial Game of Actor-Critics	Apr 20, 2022	continuous-controlContinuous Control	—Unverified
Utilizing Skipped Frames in Action Repeats via Pseudo-Actions	May 7, 2021	continuous-controlContinuous Control	—Unverified
Wish you were here: Hindsight Goal Selection for long-horizon dexterous manipulation	Dec 1, 2021	continuous-controlContinuous Control	—Unverified
Safe Planning and Policy Optimization via World Model Learning	Jun 5, 2025	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 19 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified