Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 1161 papers

Title	Date	Tasks	Status	Hype
An Experimental Design Perspective on Model-Based Reinforcement Learning	Dec 9, 2021	continuous-controlContinuous Control	CodeCode Available	1
Simple random search provides a competitive approach to reinforcement learning	Mar 19, 2018	Computational Efficiencycontinuous-control	CodeCode Available	1
Dream to Control: Learning Behaviors by Latent Imagination	Dec 3, 2019	Continuous Controlreinforcement-learning	CodeCode Available	1
Dynamic Sparse Training for Deep Reinforcement Learning	Jun 8, 2021	continuous-controlContinuous Control	CodeCode Available	1
Continuous descriptor-based control for deep audio synthesis	Feb 27, 2023	Audio Synthesiscontinuous-control	CodeCode Available	1
Amortizing intractable inference in diffusion models for vision, language, and control	May 31, 2024	continuous-controlContinuous Control	CodeCode Available	1
Optimistic Curiosity Exploration and Conservative Exploitation with Linear Reward Shaping	Sep 15, 2022	continuous-controlContinuous Control	CodeCode Available	1
Continuous MDP Homomorphisms and Homomorphic Policy Gradient	Sep 15, 2022	continuous-controlContinuous Control	CodeCode Available	1
SplAgger: Split Aggregation for Meta-Reinforcement Learning	Mar 5, 2024	continuous-controlContinuous Control	CodeCode Available	1
Stochastic Actor-Executor-Critic for Image-to-Image Translation	Dec 14, 2021	continuous-controlContinuous Control	CodeCode Available	1
Hamilton-Jacobi Deep Q-Learning for Deterministic Continuous-Time Systems with Lipschitz Continuous Controls	Oct 27, 2020	continuous-controlContinuous Control	CodeCode Available	1
Direct Behavior Specification via Constrained Reinforcement Learning	Dec 22, 2021	continuous-controlContinuous Control	CodeCode Available	1
Learning to Guide Random Search	Apr 25, 2020	Bayesian Optimizationcontinuous-control	CodeCode Available	1
Task-Agnostic Continual Reinforcement Learning: Gaining Insights and Overcoming Challenges	May 28, 2022	Continual LearningContinuous Control	CodeCode Available	1
Addressing Function Approximation Error in Actor-Critic Methods	Feb 26, 2018	Continuous ControlOpenAI Gym	CodeCode Available	1
Reinforcement Learning with Prototypical Representations	Feb 22, 2021	continuous-controlContinuous Control	CodeCode Available	1
Contrastive Variational Reinforcement Learning for Complex Observations	Aug 6, 2020	Atari GamesContinuous Control	CodeCode Available	1
Tonic: A Deep Reinforcement Learning Library for Fast Prototyping and Benchmarking	Nov 15, 2020	Benchmarkingcontinuous-control	CodeCode Available	1
An Experimental Design Perspective on Exploration in Reinforcement Learning	Sep 29, 2021	continuous-controlContinuous Control	—Unverified	0
Adjacency constraint for efficient hierarchical reinforcement learning	Oct 30, 2021	continuous-controlContinuous Control	—Unverified	0
DATD3: Depthwise Attention Twin Delayed Deep Deterministic Policy Gradient For Model Free Reinforcement Learning Under Output Feedback Control	May 29, 2025	continuous-controlContinuous Control	—Unverified	0
Bi-Level Policy Optimization with Nyström Hypergradients	May 16, 2025	Bilevel Optimizationcontinuous-control	—Unverified	0
Dive into the Power of Neuronal Heterogeneity	May 19, 2023	continuous-controlContinuous Control	—Unverified	0
Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning	Apr 23, 2020	continuous-controlContinuous Control	—Unverified	0
Biased Estimates of Advantages over Path Ensembles	Sep 15, 2019	Atari Gamescontinuous-control	—Unverified	0
Time-Varying Propensity Score to Bridge the Gap between the Past and Present	Oct 4, 2022	continuous-controlContinuous Control	—Unverified	0
Action Noise in Off-Policy Deep Reinforcement Learning: Impact on Exploration and Performance	Jun 8, 2022	continuous-controlContinuous Control	—Unverified	0
Better Exploration with Optimistic Actor-Critic	Oct 28, 2019	continuous-controlContinuous Control	—Unverified	0
CUER: Corrected Uniform Experience Replay for Off-Policy Continuous Deep Reinforcement Learning Algorithms	Jun 13, 2024	continuous-controlContinuous Control	—Unverified	0
An Efficient Continuous Control Perspective for Reinforcement-Learning-based Sequential Recommendation	Aug 15, 2024	continuous-controlContinuous Control	—Unverified	0
DSAC: Distributional Soft Actor Critic for Risk-Sensitive Reinforcement Learning	Apr 30, 2020	continuous-controlContinuous Control	—Unverified	0
Divide-and-Conquer Monte Carlo Tree Search	Jan 1, 2021	continuous-controlContinuous Control	—Unverified	0
Ctrl-Z: Recovering from Instability in Reinforcement Learning	Oct 9, 2019	continuous-controlContinuous Control	—Unverified	0
Distributional Decision Transformer for Hindsight Information Matching	Sep 29, 2021	continuous-controlContinuous Control	—Unverified	0
Crowdfunding Dynamics Tracking: A Reinforcement Learning Approach	Dec 27, 2019	continuous-controlContinuous Control	—Unverified	0
Benchmarking Smoothness and Reducing High-Frequency Oscillations in Continuous Control Policies	Oct 22, 2024	Benchmarkingcontinuous-control	—Unverified	0
Distributionally Robust Reinforcement Learning	Feb 23, 2019	continuous-controlContinuous Control	—Unverified	0
Cross-Episodic Curriculum for Transformer Agents	Oct 12, 2023	continuous-controlContinuous Control	—Unverified	0
Critic PI2: Master Continuous Planning via Policy Improvement with Path Integrals and Deep Actor-Critic Reinforcement Learning	Nov 13, 2020	continuous-controlContinuous Control	—Unverified	0
Curious Meta-Controller: Adaptive Alternation between Model-Based and Model-Free Control in Deep Reinforcement Learning	May 5, 2019	continuous-controlContinuous Control	—Unverified	0
Analyzing the Impact of Class Transitions on the Design of Pattern Recognition-based Myoelectric Control Schemes	Sep 21, 2024	continuous-controlContinuous Control	—Unverified	0
Curriculum Offline Imitating Learning	Dec 1, 2021	continuous-controlContinuous Control	—Unverified	0
Analysis and Optimisation of Bellman Residual Errors with Neural Function Approximation	Jun 16, 2021	continuous-controlContinuous Control	—Unverified	0
Corrected Soft Actor Critic for Continuous Control	Oct 22, 2024	continuous-controlContinuous Control	—Unverified	0
Data-driven battery operation for energy arbitrage using rainbow deep reinforcement learning	Jun 10, 2021	continuous-controlContinuous Control	—Unverified	0
Data Driven Control with Learned Dynamics: Model-Based versus Model-Free Approach	Jun 16, 2020	continuous-controlContinuous Control	—Unverified	0
ABC-LMPC: Safe Sample-Based Learning MPC for Stochastic Nonlinear Dynamical Systems with Adjustable Boundary Conditions	Mar 3, 2020	continuous-controlContinuous Control	—Unverified	0
Data-efficient Deep Reinforcement Learning for Dexterous Manipulation	Apr 10, 2017	continuous-controlContinuous Control	—Unverified	0
COPlanner: Plan to Roll Out Conservatively but to Explore Optimistically for Model-Based RL	Oct 11, 2023	continuous-controlContinuous Control	—Unverified	0
Analysis of potential flow networks: Variations in transport time with discrete, continuous, and selfish operation	Oct 17, 2023	continuous-controlContinuous Control	—Unverified	0

Show:10 25 50

← PrevPage 5 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified