Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 1161 papers

Title	Date	Tasks	Status	Hype
Bisimulation metric for Model Predictive Control	Oct 6, 2024	Computational Efficiencycontinuous-control	CodeCode Available	0
C-MORL: Multi-Objective Reinforcement Learning through Efficient Discovery of Pareto Front	Oct 3, 2024	continuous-controlContinuous Control	CodeCode Available	1
Absolute State-wise Constrained Policy Optimization: High-Probability State-wise Constraints Satisfaction	Oct 2, 2024	Autonomous Drivingcontinuous-control	—Unverified	0
Sampling from Energy-based Policies using Diffusion	Oct 2, 2024	continuous-controlContinuous Control	—Unverified	0
Double Actor-Critic with TD Error-Driven Regularization in Reinforcement Learning	Sep 28, 2024	continuous-controlContinuous Control	—Unverified	0
DMC-VB: A Benchmark for Representation Learning for Control with Visual Distractors	Sep 26, 2024	continuous-controlContinuous Control	CodeCode Available	1
Analyzing the Impact of Class Transitions on the Design of Pattern Recognition-based Myoelectric Control Schemes	Sep 21, 2024	continuous-controlContinuous Control	—Unverified	0
Quasimetric Value Functions with Dense Rewards	Sep 13, 2024	continuous-controlContinuous Control	—Unverified	0
Soft Actor-Critic with Beta Policy via Implicit Reparameterization Gradients	Sep 8, 2024	continuous-controlContinuous Control	CodeCode Available	0
Stacked Universal Successor Feature Approximators for Safety in Reinforcement Learning	Sep 6, 2024	continuous-controlContinuous Control	—Unverified	0
Diffusion Policy Policy Optimization	Sep 1, 2024	continuous-controlContinuous Control	CodeCode Available	4
Research Advances and New Paradigms for Biology-inspired Spiking Neural Networks	Aug 26, 2024	Automatic Speech RecognitionBrain Computer Interface	—Unverified	0
Deterministic Policy Gradient Primal-Dual Methods for Continuous-Space Constrained MDPs	Aug 19, 2024	continuous-controlContinuous Control	—Unverified	0
An Efficient Continuous Control Perspective for Reinforcement-Learning-based Sequential Recommendation	Aug 15, 2024	continuous-controlContinuous Control	—Unverified	0
Multi-Agent Continuous Control with Generative Flow Networks	Aug 13, 2024	continuous-controlContinuous Control	CodeCode Available	0
Model-Based Transfer Learning for Contextual Reinforcement Learning	Aug 8, 2024	Bayesian Optimizationcontinuous-control	CodeCode Available	1
Highly Efficient Self-Adaptive Reward Shaping for Reinforcement Learning	Aug 6, 2024	Continuous ControlDensity Estimation	—Unverified	0
Generalized Gaussian Temporal Difference Error for Uncertainty-aware Reinforcement Learning	Aug 5, 2024	continuous-controlContinuous Control	CodeCode Available	0
Discretizing Continuous Action Space with Unimodal Probability Distributions for On-Policy Reinforcement Learning	Aug 1, 2024	continuous-controlContinuous Control	CodeCode Available	0
Image-Based Deep Reinforcement Learning with Intrinsically Motivated Stimuli: On the Execution of Complex Robotic Tasks	Jul 31, 2024	continuous-controlContinuous Control	—Unverified	0
Black box meta-learning intrinsic rewards for sparse-reward environments	Jul 31, 2024	continuous-controlContinuous Control	CodeCode Available	0
QT-TDM: Planning With Transformer Dynamics Model and Autoregressive Q-Learning	Jul 26, 2024	continuous-controlContinuous Control	—Unverified	0
The Cross-environment Hyperparameter Setting Benchmark for Reinforcement Learning	Jul 26, 2024	continuous-controlContinuous Control	—Unverified	0
PreciseControl: Enhancing Text-To-Image Diffusion Models with Fine-Grained Attribute Control	Jul 24, 2024	Attributecontinuous-control	—Unverified	0
Proximal Policy Distillation	Jul 21, 2024	continuous-controlContinuous Control	CodeCode Available	0
Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning	Jul 15, 2024	continuous-controlContinuous Control	—Unverified	0
Aligning Diffusion Behaviors with Q-functions for Efficient Continuous Control	Jul 12, 2024	continuous-controlContinuous Control	CodeCode Available	1
Continuous Control with Coarse-to-fine Reinforcement Learning	Jul 10, 2024	continuous-controlContinuous Control	—Unverified	0
A Novel Bifurcation Method for Observation Perturbation Attacks on Reinforcement Learning Agents: Load Altering Attacks on a Cyber Physical Power System	Jul 6, 2024	continuous-controlContinuous Control	—Unverified	0
ROER: Regularized Optimal Experience Replay	Jul 4, 2024	continuous-controlContinuous Control	CodeCode Available	0
RobocupGym: A challenging continuous control benchmark in Robocup	Jul 3, 2024	Board Gamescontinuous-control	CodeCode Available	1
PWM: Policy Learning with Multi-Task World Models	Jul 2, 2024	continuous-controlContinuous Control	—Unverified	0
Optimizing Energy-Efficient Braking Trajectories with Anticipatory Road Data for Automated Vehicles	Jun 25, 2024	continuous-controlContinuous Control	—Unverified	0
Behaviour Distillation	Jun 21, 2024	Continual Learningcontinuous-control	CodeCode Available	0
Memory Sequence Length of Data Sampling Impacts the Adaptation of Meta-Reinforcement Learning Agents	Jun 18, 2024	continuous-controlContinuous Control	—Unverified	0
Discovering Minimal Reinforcement Learning Environments	Jun 18, 2024	continuous-controlContinuous Control	CodeCode Available	1
Dynamic Modeling and Control for an Offshore Semisubmersible Floating Wind Turbine	Jun 17, 2024	continuous-controlContinuous Control	—Unverified	0
Solving Vision Tasks with Simple Photoreceptors Instead of Cameras	Jun 17, 2024	continuous-controlContinuous Control	—Unverified	0
EvIL: Evolution Strategies for Generalisable Imitation Learning	Jun 15, 2024	Behavioural cloningcontinuous-control	CodeCode Available	1
CUER: Corrected Uniform Experience Replay for Off-Policy Continuous Deep Reinforcement Learning Algorithms	Jun 13, 2024	continuous-controlContinuous Control	—Unverified	0
RRLS : Robust Reinforcement Learning Suite	Jun 12, 2024	continuous-controlContinuous Control	CodeCode Available	1
Time-Constrained Robust MDPs	Jun 12, 2024	continuous-controlContinuous Control	—Unverified	0
PlanDQ: Hierarchical Plan Orchestration via D-Conductor and Q-Performer	Jun 10, 2024	continuous-controlContinuous Control	CodeCode Available	1
Exploring Pessimism and Optimism Dynamics in Deep Reinforcement Learning	Jun 6, 2024	continuous-controlContinuous Control	—Unverified	0
iQRL -- Implicitly Quantized Representations for Sample-efficient Reinforcement Learning	Jun 4, 2024	continuous-controlContinuous Control	—Unverified	0
Do's and Don'ts: Learning Desirable Skills with Instruction Videos	Jun 1, 2024	continuous-controlContinuous Control	—Unverified	0
Amortizing intractable inference in diffusion models for vision, language, and control	May 31, 2024	continuous-controlContinuous Control	CodeCode Available	1
Gaussian Flow Bridges for Audio Domain Transfer with Unpaired Data	May 29, 2024	continuous-controlContinuous Control	CodeCode Available	0
Spectral-Risk Safe Reinforcement Learning with Convergence Guarantees	May 29, 2024	Bilevel Optimizationcontinuous-control	—Unverified	0
Mollification Effects of Policy Gradient Methods	May 28, 2024	continuous-controlContinuous Control	—Unverified	0

Show:10 25 50

← PrevPage 3 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified