Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 1161 papers

Title	Date	Tasks	Status	Hype
Reinforcement Learning with Prototypical Representations	Mar 9, 2021	continuous-controlContinuous Control	CodeCode Available	1
Model-free Policy Learning with Reward Gradients	Mar 9, 2021	Continuous Controlmodel	CodeCode Available	1
Latent Imagination Facilitates Zero-Shot Transfer in Autonomous Racing	Mar 8, 2021	Autonomous Racingcontinuous-control	CodeCode Available	1
Vision-Based Mobile Robotics Obstacle Avoidance With Deep Reinforcement Learning	Mar 8, 2021	Atari GamesAutonomous Navigation	—Unverified	0
Multimodal VAE Active Inference Controller	Mar 7, 2021	continuous-controlContinuous Control	CodeCode Available	0
Analysis and Assessment of Controllability of an Expressive Deep Learning-based TTS system	Mar 6, 2021	continuous-controlContinuous Control	CodeCode Available	1
Correct-by-construction reach-avoid control of partially observable linear stochastic systems	Mar 3, 2021	Continuous Control	CodeCode Available	0
Foresee then Evaluate: Decomposing Value Estimation with Latent Future Prediction	Mar 3, 2021	continuous-controlContinuous Control	CodeCode Available	0
Snowflake: Scaling GNNs to High-Dimensional Continuous Control via Parameter Freezing	Mar 1, 2021	continuous-controlContinuous Control	CodeCode Available	0
Hamiltonian Policy Optimization	Feb 28, 2021	continuous-controlContinuous Control	—Unverified	0
Revisiting Peng's Q(λ) for Modern Reinforcement Learning	Feb 27, 2021	continuous-controlContinuous Control	—Unverified	0
Low-Precision Reinforcement Learning: Running Soft Actor-Critic in Half Precision	Feb 26, 2021	continuous-controlContinuous Control	—Unverified	0
Twin actor twin delayed deep deterministic policy gradient (TATD3) learning for batch process control	Feb 25, 2021	continuous-controlContinuous Control	—Unverified	0
Imitation Learning with Human Eye Gaze via Multi-Objective Prediction	Feb 25, 2021	Continuous ControlImitation Learning	CodeCode Available	0
DeepThermal: Combustion Optimization for Thermal Power Generating Units Using Offline Reinforcement Learning	Feb 23, 2021	Continuous ControlOffline RL	—Unverified	0
Uncertainty Estimation Using Riemannian Model~Dynamics for Offline Reinforcement Learning	Feb 22, 2021	Autonomous Drivingcontinuous-control	—Unverified	0
Reinforcement Learning with Prototypical Representations	Feb 22, 2021	continuous-controlContinuous Control	CodeCode Available	1
On Proximal Policy Optimization's Heavy-tailed Gradients	Feb 20, 2021	continuous-controlContinuous Control	—Unverified	0
Model-Invariant State Abstractions for Model-Based Reinforcement Learning	Feb 19, 2021	continuous-controlContinuous Control	—Unverified	0
On the Sample Complexity of Stability Constrained Imitation Learning	Feb 18, 2021	continuous-controlContinuous Control	—Unverified	0
Learning Memory-Dependent Continuous Control from Demonstrations	Feb 18, 2021	continuous-controlContinuous Control	—Unverified	0
Q-Value Weighted Regression: Reinforcement Learning with Limited Data	Feb 12, 2021	Atari Gamescontinuous-control	CodeCode Available	0
Robust Policy Gradient against Strong Data Corruption	Feb 11, 2021	continuous-controlContinuous Control	CodeCode Available	0
Modeling the Interaction between Agents in Cooperative Multi-Agent Reinforcement Learning	Feb 10, 2021	continuous-controlContinuous Control	—Unverified	0
Measuring Progress in Deep Reinforcement Learning Sample Efficiency	Feb 9, 2021	Atari Gamescontinuous-control	—Unverified	0
Tactical Optimism and Pessimism for Deep Reinforcement Learning	Feb 7, 2021	continuous-controlContinuous Control	CodeCode Available	1
OffCon^3: What is state of the art anyway?	Jan 27, 2021	continuous-controlContinuous Control	CodeCode Available	1
Decoupled Exploration and Exploitation Policies for Sample-Efficient Reinforcement Learning	Jan 23, 2021	continuous-controlContinuous Control	—Unverified	0
Robust Reinforcement Learning on State Observations with Learned Optimal Adversary	Jan 21, 2021	Adversarial Attackcontinuous-control	CodeCode Available	1
ES-ENAS: Efficient Evolutionary Optimization for Large Hybrid Search Spaces	Jan 19, 2021	Combinatorial OptimizationContinuous Control	CodeCode Available	0
Linear Representation Meta-Reinforcement Learning for Instant Adaptation	Jan 12, 2021	continuous-controlContinuous Control	—Unverified	0
CoachNet: An Adversarial Sampling Approach for Reinforcement Learning	Jan 7, 2021	continuous-controlContinuous Control	—Unverified	0
Reinforcement Learning with Latent Flow	Jan 6, 2021	Atari Gamescontinuous-control	CodeCode Available	1
Markov Chain Monte Carlo Policy Optimization	Jan 4, 2021	continuous-controlContinuous Control	—Unverified	0
Derivative-Free Policy Optimization for Linear Risk-Sensitive and Robust Control Design: Implicit Regularization and Sample Complexity	Jan 4, 2021	continuous-controlContinuous Control	—Unverified	0
Learning Subgoal Representations with Slow Dynamics	Jan 1, 2021	continuous-controlContinuous Control	—Unverified	0
Deep Reinforcement Learning With Adaptive Combined Critics	Jan 1, 2021	continuous-controlContinuous Control	—Unverified	0
TEAC: Intergrating Trust Region and Max Entropy Actor Critic for Continuous Control	Jan 1, 2021	continuous-controlContinuous Control	CodeCode Available	0
Unsupervised Task Clustering for Multi-Task Reinforcement Learning	Jan 1, 2021	Atari GamesClustering	CodeCode Available	0
Self-Supervised Continuous Control without Policy Gradient	Jan 1, 2021	continuous-controlContinuous Control	—Unverified	0
Unbiased learning with State-Conditioned Rewards in Adversarial Imitation Learning	Jan 1, 2021	continuous-controlContinuous Control	—Unverified	0
Learning Efficient Planning-based Rewards for Imitation Learning	Jan 1, 2021	Atari Gamescontinuous-control	—Unverified	0
What Matters for On-Policy Deep Actor-Critic Methods? A Large-Scale Study	Jan 1, 2021	Attributecontinuous-control	—Unverified	0
Error Controlled Actor-Critic Method to Reinforcement Learning	Jan 1, 2021	continuous-controlContinuous Control	—Unverified	0
Sample efficient Quality Diversity for neural continuous control	Jan 1, 2021	continuous-controlContinuous Control	—Unverified	0
Regularization Matters in Policy Optimization - An Empirical Study on Continuous Control	Jan 1, 2021	continuous-controlContinuous Control	CodeCode Available	0
Learning Latent Landmarks for Generalizable Planning	Jan 1, 2021	continuous-controlContinuous Control	—Unverified	0
Genetic Soft Updates for Policy Evolution in Deep Reinforcement Learning	Jan 1, 2021	continuous-controlContinuous Control	—Unverified	0
Offline Policy Optimization with Variance Regularization	Jan 1, 2021	continuous-controlContinuous Control	—Unverified	0
Divide-and-Conquer Monte Carlo Tree Search	Jan 1, 2021	continuous-controlContinuous Control	—Unverified	0

Show:10 25 50

← PrevPage 14 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified