Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–750 of 1161 papers

Title	Date	Tasks	Status
Value-Based Reinforcement Learning for Continuous Control Robotic Manipulation in Multi-Task Sparse Reward Settings	Jul 28, 2021	continuous-controlContinuous Control	—Unverified
Cautious Actor-Critic	Jul 12, 2021	continuous-controlContinuous Control	—Unverified
Coordinate-wise Control Variates for Deep Policy Gradients	Jul 11, 2021	continuous-controlContinuous Control	—Unverified
Imitation by Predicting Observations	Jul 8, 2021	continuous-controlContinuous Control	—Unverified
SA-MATD3:Self-attention-based multi-agent continuous control method in cooperative environments	Jul 1, 2021	continuous-controlContinuous Control	—Unverified
Continuous Control with Deep Reinforcement Learning for Autonomous Vessels	Jun 27, 2021	Collision Avoidancecontinuous-control	—Unverified
Model-Advantage and Value-Aware Models for Model-Based Reinforcement Learning: Bridging the Gap in Theory and Practice	Jun 26, 2021	continuous-controlContinuous Control	CodeCode Available
Controlling the Rain: From Removal to Rendering	Jun 19, 2021	continuous-controlContinuous Control	—Unverified
Strategically-timed State-Observation Attacks on Deep Reinforcement Learning Agents	Jun 18, 2021	Adversarial Attackcontinuous-control	—Unverified
Analysis and Optimisation of Bellman Residual Errors with Neural Function Approximation	Jun 16, 2021	continuous-controlContinuous Control	—Unverified
On the Sample Complexity and Metastability of Heavy-tailed Policy Search in Continuous Control	Jun 15, 2021	continuous-controlContinuous Control	—Unverified
Learning of feature points without additional supervision improves reinforcement learning from images	Jun 15, 2021	Continuous Controlreinforcement-learning	CodeCode Available
Keyframe-Focused Visual Imitation Learning	Jun 11, 2021	continuous-controlContinuous Control	—Unverified
Offline Reinforcement Learning as Anti-Exploration	Jun 11, 2021	continuous-controlContinuous Control	—Unverified
Data-driven battery operation for energy arbitrage using rainbow deep reinforcement learning	Jun 10, 2021	continuous-controlContinuous Control	—Unverified
Bayesian Bellman Operators	Jun 9, 2021	continuous-controlContinuous Control	—Unverified
Average-Reward Reinforcement Learning with Trust Region Methods	Jun 7, 2021	continuous-controlContinuous Control	—Unverified
What Matters for Adversarial Imitation Learning?	Jun 1, 2021	continuous-controlContinuous Control	—Unverified
Active Hierarchical Exploration with Stable Subgoal Representation Learning	May 31, 2021	continuous-controlContinuous Control	CodeCode Available
A Prototype of Reconfigurable Intelligent Surface with Continuous Control of the Reflection Phase	May 25, 2021	continuous-controlContinuous Control	—Unverified
Hyperparameter Selection for Imitation Learning	May 25, 2021	continuous-controlContinuous Control	—Unverified
Generative Actor-Critic: An Off-policy Algorithm Using the Push-forward Model	May 8, 2021	continuous-controlContinuous Control	CodeCode Available
Utilizing Skipped Frames in Action Repeats via Pseudo-Actions	May 7, 2021	continuous-controlContinuous Control	—Unverified
Context-Based Soft Actor Critic for Environments with Non-stationary Dynamics	May 7, 2021	continuous-controlContinuous Control	CodeCode Available
Autoregressive Dynamics Models for Offline Policy Evaluation and Optimization	Apr 28, 2021	continuous-controlContinuous Control	—Unverified
Policy Manifold Search: Exploring the Manifold Hypothesis for Diversity-based Neuroevolution	Apr 27, 2021	continuous-controlContinuous Control	—Unverified
Safe Continuous Control with Constrained Model-Based Policy Optimization	Apr 14, 2021	continuous-controlContinuous Control	CodeCode Available
Reward function shape exploration in adversarial imitation learning: an empirical study	Apr 14, 2021	continuous-controlContinuous Control	—Unverified
Learning and Planning in Complex Action Spaces	Apr 13, 2021	continuous-controlContinuous Control	—Unverified
GEM: Group Enhanced Model for Learning Dynamical Control Systems	Apr 7, 2021	continuous-controlContinuous Control	—Unverified
LazyDAgger: Reducing Context Switching in Interactive Imitation Learning	Mar 31, 2021	continuous-controlContinuous Control	—Unverified
Policy Information Capacity: Information-Theoretic Measure for Task Complexity in Deep Reinforcement Learning	Mar 23, 2021	continuous-controlContinuous Control	CodeCode Available
Hamiltonian Policy Optimization in Reinforcement Learning	Mar 23, 2021	continuous-controlContinuous Control	—Unverified
Improving Actor-Critic Reinforcement Learning via Hamiltonian Monte Carlo Method	Mar 22, 2021	continuous-controlContinuous Control	—Unverified
Maximum Entropy Reinforcement Learning with Mixture Policies	Mar 18, 2021	continuous-controlContinuous Control	—Unverified
Discovering Diverse Solutions in Deep Reinforcement Learning by Maximizing State-Action-Based Mutual Information	Mar 12, 2021	Continuous ControlDeep Reinforcement Learning	CodeCode Available
A Quadratic Actor Network for Model-Free Reinforcement Learning	Mar 11, 2021	continuous-controlContinuous Control	CodeCode Available
Learning State Representations via Temporal Cycle-Consistency Constraint in Model-Based Reinforcement Learning	Mar 9, 2021	continuous-controlContinuous Control	—Unverified
Vision-Based Mobile Robotics Obstacle Avoidance With Deep Reinforcement Learning	Mar 8, 2021	Atari GamesAutonomous Navigation	—Unverified
Multimodal VAE Active Inference Controller	Mar 7, 2021	continuous-controlContinuous Control	CodeCode Available
Correct-by-construction reach-avoid control of partially observable linear stochastic systems	Mar 3, 2021	Continuous Control	CodeCode Available
Foresee then Evaluate: Decomposing Value Estimation with Latent Future Prediction	Mar 3, 2021	continuous-controlContinuous Control	CodeCode Available
Snowflake: Scaling GNNs to High-Dimensional Continuous Control via Parameter Freezing	Mar 1, 2021	continuous-controlContinuous Control	CodeCode Available
Hamiltonian Policy Optimization	Feb 28, 2021	continuous-controlContinuous Control	—Unverified
Revisiting Peng's Q(λ) for Modern Reinforcement Learning	Feb 27, 2021	continuous-controlContinuous Control	—Unverified
Low-Precision Reinforcement Learning: Running Soft Actor-Critic in Half Precision	Feb 26, 2021	continuous-controlContinuous Control	—Unverified
Imitation Learning with Human Eye Gaze via Multi-Objective Prediction	Feb 25, 2021	Continuous ControlImitation Learning	CodeCode Available
Twin actor twin delayed deep deterministic policy gradient (TATD3) learning for batch process control	Feb 25, 2021	continuous-controlContinuous Control	—Unverified
DeepThermal: Combustion Optimization for Thermal Power Generating Units Using Offline Reinforcement Learning	Feb 23, 2021	Continuous ControlOffline RL	—Unverified
Uncertainty Estimation Using Riemannian Model~Dynamics for Offline Reinforcement Learning	Feb 22, 2021	Autonomous Drivingcontinuous-control	—Unverified

Show:10 25 50

← PrevPage 15 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified