Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 1161 papers

Title	Date	Tasks	Status	Hype
#Exploration: A Study of Count-Based Exploration for Deep Reinforcement Learning	Nov 15, 2016	Atari Gamescontinuous-control	CodeCode Available	1
Contrastive Variational Reinforcement Learning for Complex Observations	Aug 6, 2020	Atari GamesContinuous Control	CodeCode Available	1
AR-DAE: Towards Unbiased Neural Entropy Gradient Estimation	Jun 9, 2020	continuous-controlContinuous Control	CodeCode Available	1
Character Controllers Using Motion VAEs	Mar 26, 2021	Continuous ControlDeep Reinforcement Learning	CodeCode Available	1
Continuous MDP Homomorphisms and Homomorphic Policy Gradient	Sep 15, 2022	continuous-controlContinuous Control	CodeCode Available	1
Continuous-Time Fitted Value Iteration for Robust Policies	Oct 5, 2021	continuous-controlContinuous Control	CodeCode Available	1
Deep Intrinsically Motivated Exploration in Continuous Control	Oct 1, 2022	continuous-controlContinuous Control	CodeCode Available	1
Generalized Policy Improvement Algorithms with Theoretically Supported Sample Reuse	Jun 28, 2022	Continuous ControlDecision Making	CodeCode Available	1
Controllable Person Image Synthesis with Attribute-Decomposed GAN	Mar 27, 2020	Attributecontinuous-control	CodeCode Available	1
How Crucial is Transformer in Decision Transformer?	Nov 26, 2022	continuous-controlContinuous Control	CodeCode Available	1
ClipUp: A Simple and Powerful Optimizer for Distribution-based Policy Evolution	Aug 5, 2020	continuous-controlContinuous Control	CodeCode Available	1
How to Leverage Diverse Demonstrations in Offline Imitation Learning	May 24, 2024	continuous-controlContinuous Control	CodeCode Available	1
Imitation Learning by Estimating Expertise of Demonstrators	Feb 2, 2022	continuous-controlContinuous Control	CodeCode Available	1
Imitation Learning via Differentiable Physics	Jun 10, 2022	continuous-controlContinuous Control	CodeCode Available	1
C-MORL: Multi-Objective Reinforcement Learning through Efficient Discovery of Pareto Front	Oct 3, 2024	continuous-controlContinuous Control	CodeCode Available	1
IQ-Learn: Inverse soft-Q Learning for Imitation	Jun 23, 2021	Atari GamesContinuous Control	CodeCode Available	1
Coarse-to-Fine Q-attention: Efficient Learning for Visual Robotic Manipulation via Discretisation	Jun 23, 2021	Continuous ControlQ-Learning	CodeCode Available	1
A System for Morphology-Task Generalization via Unified Representation and Behavior Distillation	Nov 25, 2022	continuous-controlContinuous Control	CodeCode Available	1
Learning Goal-Conditioned Policies Offline with Self-Supervised Reward Shaping	Jan 5, 2023	continuous-controlContinuous Control	CodeCode Available	1
Learning Interpretable, High-Performing Policies for Autonomous Driving	Feb 4, 2022	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
Attacking Cooperative Multi-Agent Reinforcement Learning by Adversarial Minority Influence	Feb 7, 2023	Continuous ControlMuJoCo	CodeCode Available	1
Learning Off-Policy with Online Planning	Aug 23, 2020	ARCContinuous Control	CodeCode Available	1
Learning to Adapt in Dynamic, Real-World Environments Through Meta-Reinforcement Learning	Mar 30, 2018	continuous-controlContinuous Control	CodeCode Available	1
Learning to Guide Random Search	Apr 25, 2020	Bayesian Optimizationcontinuous-control	CodeCode Available	1
Cross-Domain Imitation Learning via Optimal Transport	Oct 7, 2021	continuous-controlContinuous Control	CodeCode Available	1
Mastering Visual Continuous Control: Improved Data-Augmented Reinforcement Learning	Jul 20, 2021	continuous-controlContinuous Control	CodeCode Available	1
Measuring Visual Generalization in Continuous Control from Pixels	Oct 13, 2020	continuous-controlContinuous Control	CodeCode Available	1
Mirror Descent Policy Optimization	May 20, 2020	continuous-controlContinuous Control	CodeCode Available	1
Aligning Diffusion Behaviors with Q-functions for Efficient Continuous Control	Jul 12, 2024	continuous-controlContinuous Control	CodeCode Available	1
Model-based Adversarial Meta-Reinforcement Learning	Jun 16, 2020	continuous-controlContinuous Control	CodeCode Available	1
Model-Based Transfer Learning for Contextual Reinforcement Learning	Aug 8, 2024	Bayesian Optimizationcontinuous-control	CodeCode Available	1
Conditional Mutual Information for Disentangled Representations in Reinforcement Learning	May 23, 2023	continuous-controlContinuous Control	CodeCode Available	1
MOPO: Model-based Offline Policy Optimization	May 27, 2020	continuous-controlContinuous Control	CodeCode Available	1
Muesli: Combining Improvements in Policy Optimization	Apr 13, 2021	Atari Gamescontinuous-control	CodeCode Available	1
Dream and Search to Control: Latent Space Planning for Continuous Control	Oct 19, 2020	continuous-controlContinuous Control	CodeCode Available	1
My Body is a Cage: the Role of Morphology in Graph-Based Incompatible Control	Oct 5, 2020	continuous-controlContinuous Control	CodeCode Available	1
Off-Policy Adversarial Inverse Reinforcement Learning	May 3, 2020	continuous-controlContinuous Control	CodeCode Available	1
Learning Constrained Adaptive Differentiable Predictive Control Policies With Guarantees	Apr 23, 2020	Continuous ControlImitation Learning	CodeCode Available	1
CrossQ: Batch Normalization in Deep Reinforcement Learning for Greater Sample Efficiency and Simplicity	Feb 14, 2019	continuous-controlContinuous Control	CodeCode Available	1
OLLIE: Imitation Learning from Offline Pretraining to Online Finetuning	May 24, 2024	continuous-controlContinuous Control	CodeCode Available	1
Hierarchical Skills for Efficient Exploration	Oct 20, 2021	continuous-controlContinuous Control	CodeCode Available	1
PD-MORL: Preference-Driven Multi-Objective Reinforcement Learning Algorithm	Aug 16, 2022	continuous-controlContinuous Control	CodeCode Available	1
Continual Reinforcement Learning with Multi-Timescale Replay	Apr 16, 2020	Continual Learningcontinuous-control	CodeCode Available	1
PlanDQ: Hierarchical Plan Orchestration via D-Conductor and Q-Performer	Jun 10, 2024	continuous-controlContinuous Control	CodeCode Available	1
Curriculum Offline Imitation Learning	Nov 3, 2021	continuous-controlContinuous Control	CodeCode Available	1
Policy Gradient Methods in the Presence of Symmetries and State Abstractions	May 9, 2023	continuous-controlContinuous Control	CodeCode Available	1
Policy Representation via Diffusion Probability Model for Reinforcement Learning	May 22, 2023	continuous-controlContinuous Control	CodeCode Available	1
Predictive Information Accelerates Learning in RL	Jul 24, 2020	continuous-controlContinuous Control	CodeCode Available	1
Option Discovery using Deep Skill Chaining	May 1, 2020	continuous-controlContinuous Control	CodeCode Available	1
Towards Automatic Actor-Critic Solutions to Continuous Control	Jun 16, 2021	continuous-controlContinuous Control	CodeCode Available	1

Show:10 25 50

← PrevPage 4 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified