Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 1161 papers

Title	Date	Tasks	Status	Hype
Generalized Decision Transformer for Offline Hindsight Information Matching	Nov 19, 2021	continuous-controlContinuous Control	CodeCode Available	1
On Effective Scheduling of Model-based Reinforcement Learning	Nov 16, 2021	continuous-controlContinuous Control	CodeCode Available	1
Curriculum Offline Imitation Learning	Nov 3, 2021	continuous-controlContinuous Control	CodeCode Available	1
URLB: Unsupervised Reinforcement Learning Benchmark	Oct 28, 2021	continuous-controlContinuous Control	CodeCode Available	1
Towards Robust Bisimulation Metric Learning	Oct 27, 2021	continuous-controlContinuous Control	CodeCode Available	1
Recurrent Off-policy Baselines for Memory-based Continuous Control	Oct 25, 2021	continuous-controlContinuous Control	CodeCode Available	1
Hierarchical Skills for Efficient Exploration	Oct 20, 2021	continuous-controlContinuous Control	CodeCode Available	1
Planning from Pixels in Environments with Combinatorially Hard Search Spaces	Oct 12, 2021	continuous-controlContinuous Control	CodeCode Available	1
Cross-Domain Imitation Learning via Optimal Transport	Oct 7, 2021	continuous-controlContinuous Control	CodeCode Available	1
Continuous-Time Fitted Value Iteration for Robust Policies	Oct 5, 2021	continuous-controlContinuous Control	CodeCode Available	1
Mastering Visual Continuous Control: Improved Data-Augmented Reinforcement Learning	Jul 20, 2021	continuous-controlContinuous Control	CodeCode Available	1
Shortest-Path Constrained Reinforcement Learning for Sparse Reward Tasks	Jul 13, 2021	continuous-controlContinuous Control	CodeCode Available	1
Towards Better Laplacian Representation in Reinforcement Learning with Generalized Graph Drawing	Jul 12, 2021	continuous-controlContinuous Control	CodeCode Available	1
Sample Efficient Reinforcement Learning via Model-Ensemble Exploration and Exploitation	Jul 5, 2021	continuous-controlContinuous Control	CodeCode Available	1
Coarse-to-Fine Q-attention: Efficient Learning for Visual Robotic Manipulation via Discretisation	Jun 23, 2021	Continuous ControlQ-Learning	CodeCode Available	1
IQ-Learn: Inverse soft-Q Learning for Imitation	Jun 23, 2021	Atari GamesContinuous Control	CodeCode Available	1
Towards Safe Reinforcement Learning via Constraining Conditional Value at Risk	Jun 18, 2021	continuous-controlContinuous Control	CodeCode Available	1
Towards Automatic Actor-Critic Solutions to Continuous Control	Jun 16, 2021	continuous-controlContinuous Control	CodeCode Available	1
Solving Continuous Control with Episodic Memory	Jun 16, 2021	continuous-controlContinuous Control	CodeCode Available	1
TempoRL: Learning When to Act	Jun 9, 2021	Continuous ControlQ-Learning	CodeCode Available	1
Dynamic Sparse Training for Deep Reinforcement Learning	Jun 8, 2021	continuous-controlContinuous Control	CodeCode Available	1
Learning Markov State Abstractions for Deep Reinforcement Learning	Jun 8, 2021	continuous-controlContinuous Control	CodeCode Available	1
Efficient Continuous Control with Double Actors and Regularized Critics	Jun 6, 2021	continuous-controlContinuous Control	CodeCode Available	1
Mitigating Covariate Shift in Imitation Learning via Offline Data Without Great Coverage	Jun 6, 2021	continuous-controlContinuous Control	CodeCode Available	1
Robust Value Iteration for Continuous Control Tasks	May 25, 2021	continuous-controlContinuous Control	CodeCode Available	1
Mitigating Covariate Shift in Imitation Learning via Offline Data With Partial Coverage	May 21, 2021	continuous-controlContinuous Control	CodeCode Available	1
Online and Offline Reinforcement Learning by Planning with a Learned Model	Apr 13, 2021	Atari GamesContinuous Control	CodeCode Available	1
TAAC: Temporally Abstract Actor-Critic for Continuous Control	Apr 13, 2021	continuous-controlContinuous Control	CodeCode Available	1
Muesli: Combining Improvements in Policy Optimization	Apr 13, 2021	Atari Gamescontinuous-control	CodeCode Available	1
Benchmarks for Deep Off-Policy Evaluation	Mar 30, 2021	Benchmarkingcontinuous-control	CodeCode Available	1
Character Controllers Using Motion VAEs	Mar 26, 2021	Continuous ControlDeep Reinforcement Learning	CodeCode Available	1
Solving Compositional Reinforcement Learning Problems via Task Reduction	Mar 13, 2021	continuous-controlContinuous Control	CodeCode Available	1
Generalizable Episodic Memory for Deep Reinforcement Learning	Mar 11, 2021	Atari Gamescontinuous-control	CodeCode Available	1
Reinforcement Learning with Prototypical Representations	Mar 9, 2021	continuous-controlContinuous Control	CodeCode Available	1
Model-free Policy Learning with Reward Gradients	Mar 9, 2021	Continuous Controlmodel	CodeCode Available	1
Latent Imagination Facilitates Zero-Shot Transfer in Autonomous Racing	Mar 8, 2021	Autonomous Racingcontinuous-control	CodeCode Available	1
Analysis and Assessment of Controllability of an Expressive Deep Learning-based TTS system	Mar 6, 2021	continuous-controlContinuous Control	CodeCode Available	1
Reinforcement Learning with Prototypical Representations	Feb 22, 2021	continuous-controlContinuous Control	CodeCode Available	1
Tactical Optimism and Pessimism for Deep Reinforcement Learning	Feb 7, 2021	continuous-controlContinuous Control	CodeCode Available	1
OffCon^3: What is state of the art anyway?	Jan 27, 2021	continuous-controlContinuous Control	CodeCode Available	1
Robust Reinforcement Learning on State Observations with Learned Optimal Adversary	Jan 21, 2021	Adversarial Attackcontinuous-control	CodeCode Available	1
Reinforcement Learning with Latent Flow	Jan 6, 2021	Atari Gamescontinuous-control	CodeCode Available	1
An Efficient Asynchronous Method for Integrating Evolutionary and Gradient-based Policy Search	Dec 10, 2020	continuous-controlContinuous Control	CodeCode Available	1
World Model as a Graph: Learning Latent Landmarks for Planning	Nov 25, 2020	continuous-controlContinuous Control	CodeCode Available	1
Tonic: A Deep Reinforcement Learning Library for Fast Prototyping and Benchmarking	Nov 15, 2020	Benchmarkingcontinuous-control	CodeCode Available	1
Few-shot Object Grounding and Mapping for Natural Language Robot Instruction Following	Nov 14, 2020	continuous-controlContinuous Control	CodeCode Available	1
PLAS: Latent Action Space for Offline Reinforcement Learning	Nov 14, 2020	continuous-controlContinuous Control	CodeCode Available	1
Hamilton-Jacobi Deep Q-Learning for Deterministic Continuous-Time Systems with Lipschitz Continuous Controls	Oct 27, 2020	continuous-controlContinuous Control	CodeCode Available	1
Iterative Amortized Policy Optimization	Oct 20, 2020	continuous-controlContinuous Control	CodeCode Available	1
Softmax Deep Double Deterministic Policy Gradients	Oct 19, 2020	continuous-controlContinuous Control	CodeCode Available	1

Show:10 25 50

← PrevPage 3 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified