Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 1161 papers

Title	Date	Tasks	Status
Minimum Description Length Control	Jul 17, 2022	Bayesian Inferencecontinuous-control	—Unverified
Combining Model-based and Model-free RL via Multi-step Control Variates	Jan 1, 2018	continuous-controlContinuous Control	—Unverified
Combine PPO with NES to Improve Exploration	May 23, 2019	continuous-controlContinuous Control	—Unverified
COLREG-Compliant Collision Avoidance for Unmanned Surface Vehicle using Deep Reinforcement Learning	Jun 16, 2020	Autonomous VehiclesCollision Avoidance	—Unverified
TD-M(PC)^2: Improving Temporal Difference MPC Through Policy Constraint	Feb 5, 2025	continuous-controlContinuous Control	—Unverified
Mix-ME: Quality-Diversity for Multi-Agent Learning	Nov 3, 2023	continuous-controlContinuous Control	—Unverified
MO2: Model-Based Offline Options	Sep 5, 2022	continuous-controlContinuous Control	—Unverified
Adversarial Multi-Agent Reinforcement Learning for Proactive False Data Injection Detection	Nov 19, 2024	continuous-controlContinuous Control	—Unverified
CoachNet: An Adversarial Sampling Approach for Reinforcement Learning	Jan 7, 2021	continuous-controlContinuous Control	—Unverified
Model-based Lookahead Reinforcement Learning	Aug 15, 2019	continuous-controlContinuous Control	—Unverified
Model-based Offline Imitation Learning with Non-expert Data	Jun 11, 2022	continuous-controlContinuous Control	—Unverified
Clustered Reinforcement Learning	Jun 6, 2019	Atari GamesClustering	—Unverified
Model-Based Safe Reinforcement Learning with Time-Varying State and Control Constraints: An Application to Intelligent Vehicles	Dec 18, 2021	Collision Avoidancecontinuous-control	—Unverified
Closing the Intent-to-Behavior Gap via Fulfillment Priority Logic	Mar 4, 2025	continuous-controlContinuous Control	—Unverified
On the Sample Complexity of Stability Constrained Imitation Learning	Feb 18, 2021	continuous-controlContinuous Control	—Unverified
Model-Based Value Estimation for Efficient Model-Free Reinforcement Learning	Feb 28, 2018	continuous-controlContinuous Control	—Unverified
CLARE: Conservative Model-Based Reward Learning for Offline Inverse Reinforcement Learning	Feb 9, 2023	continuous-controlContinuous Control	—Unverified
A Bayesian Approach to Generative Adversarial Imitation Learning	Dec 1, 2018	continuous-controlContinuous Control	—Unverified
Model-free Learning Control of Nonlinear Stochastic Systems with Stability Guarantee	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Model-Free Linear Quadratic Control via Reduction to Expert Prediction	Apr 17, 2018	continuous-controlContinuous Control	—Unverified
CLAM: Continuous Latent Action Models for Robot Learning from Unlabeled Demonstrations	May 8, 2025	continuous-controlContinuous Control	—Unverified
Modeling the Interaction between Agents in Cooperative Multi-Agent Reinforcement Learning	Feb 10, 2021	continuous-controlContinuous Control	—Unverified
Model-Invariant State Abstractions for Model-Based Reinforcement Learning	Feb 19, 2021	continuous-controlContinuous Control	—Unverified
Temporal Abstractions-Augmented Temporally Contrastive Learning: An Alternative to the Laplacian in RL	Mar 21, 2022	continuous-controlContinuous Control	—Unverified
Adversarially Trained Weighted Actor-Critic for Safe Offline Reinforcement Learning	Jan 1, 2024	continuous-controlContinuous Control	—Unverified
Mollification Effects of Policy Gradient Methods	May 28, 2024	continuous-controlContinuous Control	—Unverified
Monte Carlo Augmented Actor-Critic for Sparse Reward Deep Reinforcement Learning from Suboptimal Demonstrations	Oct 14, 2022	continuous-controlContinuous Control	—Unverified
Monte Carlo Beam Search for Actor-Critic Reinforcement Learning in Continuous Control	May 13, 2025	Computational Efficiencycontinuous-control	—Unverified
CIM: Constrained Intrinsic Motivation for Sparse-Reward Continuous Control	Nov 28, 2022	continuous-controlContinuous Control	—Unverified
More Control for Free! Image Synthesis with Semantic Diffusion Guidance	Dec 10, 2021	continuous-controlContinuous Control	—Unverified
Motion Perception in Reinforcement Learning with Dynamic Objects	Jan 10, 2019	continuous-controlContinuous Control	—Unverified
Challenging On Car Racing Problem from OpenAI gym	Nov 2, 2019	Car Racingcontinuous-control	—Unverified
Temporal Difference Models: Model-Free Deep RL for Model-Based Control	Feb 25, 2018	continuous-controlContinuous Control	—Unverified
Multi-agent Policy Reciprocity with Theoretical Guarantee	Apr 12, 2023	continuous-controlContinuous Control	—Unverified
Multi-Agent Reinforcement Learning in Cournot Games	Sep 14, 2020	continuous-controlContinuous Control	—Unverified
Multi-Agent Reinforcement Learning with Multi-Step Generative Models	Jan 29, 2019	continuous-controlContinuous Control	—Unverified
Multi-batch Reinforcement Learning via Sample Transfer and Imitation Learning	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
Temporally Layered Architecture for Adaptive, Distributed and Continuous Control	Dec 25, 2022	continuous-controlContinuous Control	—Unverified
Multi-Issue Bargaining With Deep Reinforcement Learning	Feb 18, 2020	continuous-controlContinuous Control	—Unverified
Weakly-Supervised Reinforcement Learning for Controllable Behavior	Apr 6, 2020	continuous-controlContinuous Control	—Unverified
Evolving Pareto-Optimal Actor-Critic Algorithms for Generalizability and Stability	Apr 8, 2022	continuous-controlContinuous Control	—Unverified
State-Conditioned Adversarial Subgoal Generation	Jan 24, 2022	continuous-controlContinuous Control	—Unverified
Multiscale Sensor Fusion and Continuous Control with Neural CDEs	Mar 16, 2022	continuous-controlContinuous Control	—Unverified
Multi-Source Transfer Learning for Deep Model-Based Reinforcement Learning	May 28, 2022	Continuous ControlModel-based Reinforcement Learning	—Unverified
Multi-step Greedy Policies in Model-Free Deep Reinforcement Learning	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Multi-step Greedy Reinforcement Learning Algorithms	Oct 7, 2019	Continuous ControlGame of Go	—Unverified
Cautious Actor-Critic	Jul 12, 2021	continuous-controlContinuous Control	—Unverified
Multi-task Learning for Continuous Control	Feb 3, 2018	continuous-controlContinuous Control	—Unverified
Causal Information Prioritization for Efficient Reinforcement Learning	Feb 14, 2025	continuous-controlContinuous Control	—Unverified
CAQL: Continuous Action Q-Learning	Sep 26, 2019	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 14 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified