Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 1161 papers

Title	Date	Tasks	Status
Zero-shot Policy Learning with Spatial Temporal RewardDecomposition on Contingency-aware Observation	Oct 17, 2019	continuous-controlContinuous Control	CodeCode Available
Mapping Navigation Instructions to Continuous Control Actions with Position-Visitation Prediction	Nov 10, 2018	continuous-controlContinuous Control	CodeCode Available
Generalized Gaussian Temporal Difference Error for Uncertainty-aware Reinforcement Learning	Aug 5, 2024	continuous-controlContinuous Control	CodeCode Available
Adaptive Diffusion Policy Optimization for Robotic Manipulation	May 13, 2025	continuous-controlContinuous Control	CodeCode Available
Marginal Policy Gradients: A Unified Family of Estimators for Bounded Action Spaces with Applications	Jun 13, 2018	continuous-controlContinuous Control	CodeCode Available
COBRA: Data-Efficient Model-Based RL through Unsupervised Object Discovery and Curiosity-Driven Exploration	May 22, 2019	continuous-controlContinuous Control	CodeCode Available
Deep Reinforcement Learning with Feedback-based Exploration	Mar 14, 2019	continuous-controlContinuous Control	CodeCode Available
Analyzing Generalization in Policy Networks: A Case Study with the Double-Integrator System	Dec 16, 2023	continuous-controlContinuous Control	CodeCode Available
TF-Replicator: Distributed Machine Learning for Researchers	Feb 1, 2019	BIG-bench Machine Learningcontinuous-control	CodeCode Available
Imitation Learning with Human Eye Gaze via Multi-Objective Prediction	Feb 25, 2021	Continuous ControlImitation Learning	CodeCode Available
Stabilizing Off-Policy Q-Learning via Bootstrapping Error Reduction	Jun 3, 2019	continuous-controlContinuous Control	CodeCode Available
Gaussian Flow Bridges for Audio Domain Transfer with Unpaired Data	May 29, 2024	continuous-controlContinuous Control	CodeCode Available
The Curse of Diversity in Ensemble-Based Exploration	May 7, 2024	Attributecontinuous-control	CodeCode Available
Autoregressive Policies for Continuous Control Deep Reinforcement Learning	Mar 27, 2019	continuous-controlContinuous Control	CodeCode Available
MCP: Learning Composable Hierarchical Control with Multiplicative Compositional Policies	May 23, 2019	continuous-controlContinuous Control	CodeCode Available
Q-Value Weighted Regression: Reinforcement Learning with Limited Data	Feb 12, 2021	Atari Gamescontinuous-control	CodeCode Available
Self-supervised Learning of Image Embedding for Continuous Control	Jan 3, 2019	continuous-controlContinuous Control	CodeCode Available
FORLORN: A Framework for Comparing Offline Methods and Reinforcement Learning for Optimization of RAN Parameters	Sep 8, 2022	Benchmarkingcontinuous-control	CodeCode Available
Memory-based control with recurrent neural networks	Dec 14, 2015	continuous-controlContinuous Control	CodeCode Available
The Differentiable Cross-Entropy Method	Sep 27, 2019	BIG-bench Machine Learningcontinuous-control	CodeCode Available
RAIL: Risk-Averse Imitation Learning	Jul 20, 2017	Autonomous Drivingcontinuous-control	CodeCode Available
Rate-Splitting for Intelligent Reflecting Surface-Aided Multiuser VR Streaming	Oct 21, 2022	Continuous ControlDeep Reinforcement Learning	CodeCode Available
Meta-Controller: Few-Shot Imitation of Unseen Embodiments and Tasks in Continuous Control	Dec 10, 2024	continuous-controlContinuous Control	CodeCode Available
Meta-Inverse Reinforcement Learning with Probabilistic Context Variables	Sep 20, 2019	continuous-controlContinuous Control	CodeCode Available
Sequence Model Imitation Learning with Unobserved Contexts	Aug 3, 2022	continuous-controlContinuous Control	CodeCode Available
The Distributional Reward Critic Framework for Reinforcement Learning Under Perturbed Rewards	Jan 11, 2024	continuous-controlContinuous Control	CodeCode Available
Meta-Q-Learning	Sep 30, 2019	continuous-controlContinuous Control	CodeCode Available
Meta reinforcement learning as task inference	May 15, 2019	continuous-controlContinuous Control	CodeCode Available
A Model-Based Approach for Improving Reinforcement Learning Efficiency Leveraging Expert Observations	Feb 29, 2024	continuous-controlContinuous Control	CodeCode Available
Minimax Optimal Online Imitation Learning via Replay Estimation	May 30, 2022	continuous-controlContinuous Control	CodeCode Available
Clipped Action Policy Gradient	Feb 21, 2018	continuous-controlContinuous Control	CodeCode Available
Foresee then Evaluate: Decomposing Value Estimation with Latent Future Prediction	Mar 3, 2021	continuous-controlContinuous Control	CodeCode Available
FlowPG: Action-constrained Policy Gradient with Normalizing Flows	Feb 7, 2024	continuous-controlContinuous Control	CodeCode Available
FI-ODE: Certifiably Robust Forward Invariance in Neural ODEs	Oct 30, 2022	Adversarial Robustnesscontinuous-control	CodeCode Available
Mixed-Integer Optimal Control via Reinforcement Learning: A Case Study on Hybrid Electric Vehicle Energy Management	May 2, 2023	continuous-controlContinuous Control	CodeCode Available
Real-Time Reinforcement Learning	Nov 11, 2019	continuous-controlContinuous Control	CodeCode Available
Understanding the Evolution of Linear Regions in Deep Reinforcement Learning	Oct 24, 2022	continuous-controlContinuous Control	CodeCode Available
Model-Advantage and Value-Aware Models for Model-Based Reinforcement Learning: Bridging the Gap in Theory and Practice	Jun 26, 2021	continuous-controlContinuous Control	CodeCode Available
Correct-by-construction reach-avoid control of partially observable linear stochastic systems	Mar 3, 2021	Continuous Control	CodeCode Available
Deep Reinforcement Learning that Matters	Sep 19, 2017	Atari GamesContinuous Control	CodeCode Available
Reconciling Spatial and Temporal Abstractions for Goal Representation	Jan 18, 2024	continuous-controlContinuous Control	CodeCode Available
Exploring reinforcement learning techniques for discrete and continuous control tasks in the MuJoCo environment	Jul 20, 2023	continuous-controlContinuous Control	CodeCode Available
ACRE: Actor-Critic with Reward-Preserving Exploration	Aug 14, 2023	continuous-controlContinuous Control	CodeCode Available
Exploration in Action Space	Mar 31, 2020	continuous-controlContinuous Control	CodeCode Available
Explaining RL Decisions with Trajectories	May 6, 2023	Attributecontinuous-control	CodeCode Available
Decoupling Meta-Reinforcement Learning with Gaussian Task Contexts and Skills	Dec 11, 2023	continuous-controlContinuous Control	CodeCode Available
Evolution-Guided Policy Gradient in Reinforcement Learning	May 21, 2018	continuous-controlContinuous Control	CodeCode Available
Model-Ensemble Trust-Region Policy Optimization	Feb 28, 2018	continuous-controlContinuous Control	CodeCode Available
VIME: Variational Information Maximizing Exploration	May 31, 2016	continuous-controlContinuous Control	CodeCode Available
Simple random search of static linear policies is competitive for reinforcement learning	Dec 1, 2018	continuous-controlContinuous Control	CodeCode Available

Show:10 25 50

← PrevPage 21 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified