Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 1161 papers

Title	Date	Tasks	Status	Hype
On the Reuse Bias in Off-Policy Reinforcement Learning	Sep 15, 2022	continuous-controlContinuous Control	CodeCode Available	0
FORLORN: A Framework for Comparing Offline Methods and Reinforcement Learning for Optimization of RAN Parameters	Sep 8, 2022	Benchmarkingcontinuous-control	CodeCode Available	0
MO2: Model-Based Offline Options	Sep 5, 2022	continuous-controlContinuous Control	—Unverified	0
Actor Prioritized Experience Replay	Sep 1, 2022	continuous-controlContinuous Control	CodeCode Available	1
Normality-Guided Distributional Reinforcement Learning for Continuous Control	Aug 28, 2022	continuous-controlContinuous Control	—Unverified	0
Efficient Planning in a Compact Latent Action Space	Aug 22, 2022	continuous-controlContinuous Control	CodeCode Available	1
Improvement of Sliding Mode Control Strategy Founded on Cascaded Doubly Fed Induction Generator Powered by a Matrix Converter	Aug 20, 2022	continuous-controlContinuous Control	—Unverified	0
PD-MORL: Preference-Driven Multi-Objective Reinforcement Learning Algorithm	Aug 16, 2022	continuous-controlContinuous Control	CodeCode Available	1
Cooperative guidance of multiple missiles: a hybrid co-evolutionary approach	Aug 15, 2022	continuous-controlContinuous Control	—Unverified	0
DDX7: Differentiable FM Synthesis of Musical Instrument Sounds	Aug 12, 2022	continuous-controlContinuous Control	—Unverified	0
Bayesian Soft Actor-Critic: A Directed Acyclic Strategy Graph Based Deep Reinforcement Learning	Aug 11, 2022	continuous-controlContinuous Control	CodeCode Available	1
Sequence Model Imitation Learning with Unobserved Contexts	Aug 3, 2022	continuous-controlContinuous Control	CodeCode Available	0
Mitigating Off-Policy Bias in Actor-Critic Methods with One-Step Q-learning: A Novel Correction Approach	Aug 1, 2022	continuous-controlContinuous Control	CodeCode Available	0
Meta Reinforcement Learning with Successor Feature Based Context	Jul 29, 2022	continuous-controlContinuous Control	—Unverified	0
Distributional Actor-Critic Ensemble for Uncertainty-Aware Continuous Control	Jul 27, 2022	continuous-controlContinuous Control	—Unverified	0
Safe and Robust Experience Sharing for Deterministic Policy Gradient Algorithms	Jul 27, 2022	continuous-controlContinuous Control	CodeCode Available	0
Live in the Moment: Learning Dynamics Model Adapted to Evolving Policy	Jul 25, 2022	continuous-controlContinuous Control	CodeCode Available	0
Learn Continuously, Act Discretely: Hybrid Action-Space Reinforcement Learning For Optimal Execution	Jul 22, 2022	Algorithmic Tradingcontinuous-control	—Unverified	0
Minimum Description Length Control	Jul 17, 2022	Bayesian Inferencecontinuous-control	—Unverified	0
Contextual Bandits with Smooth Regret: Efficient Learning in Continuous Action Spaces	Jul 12, 2022	continuous-controlContinuous Control	CodeCode Available	0
Compactly Restrictable Metric Policy Optimization Problems	Jul 12, 2022	continuous-controlContinuous Control	—Unverified	0
Learning Bellman Complete Representations for Offline Policy Evaluation	Jul 12, 2022	continuous-controlContinuous Control	CodeCode Available	0
Learning Temporally Extended Skills in Continuous Domains as Symbolic Actions for Planning	Jul 11, 2022	continuous-controlContinuous Control	—Unverified	0
Robust Reinforcement Learning in Continuous Control Tasks with Uncertainty Set Regularization	Jul 5, 2022	continuous-controlContinuous Control	CodeCode Available	0
Goal-Conditioned Generators of Deep Policies	Jul 4, 2022	continuous-controlContinuous Control	CodeCode Available	1
General Policy Evaluation and Improvement by Learning to Identify Few But Crucial States	Jul 4, 2022	continuous-controlContinuous Control	CodeCode Available	0
Offline Policy Optimization with Eligible Actions	Jul 1, 2022	continuous-controlContinuous Control	CodeCode Available	0
Depth-CUPRL: Depth-Imaged Contrastive Unsupervised Prioritized Representations in Reinforcement Learning for Mapless Navigation of Unmanned Aerial Vehicles	Jun 30, 2022	continuous-controlContinuous Control	—Unverified	0
Generalized Policy Improvement Algorithms with Theoretically Supported Sample Reuse	Jun 28, 2022	Continuous ControlDecision Making	CodeCode Available	1
Guided Exploration in Reinforcement Learning via Monte Carlo Critic Optimization	Jun 25, 2022	continuous-controlContinuous Control	CodeCode Available	0
Walk the Random Walk: Learning to Discover and Reach Goals Without Supervision	Jun 23, 2022	continuous-controlContinuous Control	—Unverified	0
Fighting Fire with Fire: Avoiding DNN Shortcuts through Priming	Jun 22, 2022	Autonomous DrivingClassification	—Unverified	0
Generalised Policy Improvement with Geometric Policy Composition	Jun 17, 2022	continuous-controlContinuous Control	—Unverified	0
Mean-Semivariance Policy Optimization via Risk-Averse Reinforcement Learning	Jun 15, 2022	Autonomous Drivingcontinuous-control	—Unverified	0
Regularizing a Model-based Policy Stationary Distribution to Stabilize Offline Reinforcement Learning	Jun 14, 2022	continuous-controlContinuous Control	CodeCode Available	0
Defending Observation Attacks in Deep Reinforcement Learning via Detection and Denoising	Jun 14, 2022	continuous-controlContinuous Control	CodeCode Available	0
Transformers are Meta-Reinforcement Learners	Jun 14, 2022	continuous-controlContinuous Control	CodeCode Available	1
Relative Policy-Transition Optimization for Fast Policy Transfer	Jun 13, 2022	continuous-controlContinuous Control	—Unverified	0
Dealing with Sparse Rewards in Continuous Control Robotics via Heavy-Tailed Policies	Jun 12, 2022	continuous-controlContinuous Control	—Unverified	0
Model-based Offline Imitation Learning with Non-expert Data	Jun 11, 2022	continuous-controlContinuous Control	—Unverified	0
Imitation Learning via Differentiable Physics	Jun 10, 2022	continuous-controlContinuous Control	CodeCode Available	1
Towards Safe Reinforcement Learning via Constraining Conditional Value-at-Risk	Jun 9, 2022	continuous-controlContinuous Control	CodeCode Available	1
Overcoming the Spectral Bias of Neural Value Approximation	Jun 9, 2022	continuous-controlContinuous Control	—Unverified	0
Challenges and Opportunities in Offline Reinforcement Learning from Visual Observations	Jun 9, 2022	Benchmarkingcontinuous-control	CodeCode Available	2
Action Noise in Off-Policy Deep Reinforcement Learning: Impact on Exploration and Performance	Jun 8, 2022	continuous-controlContinuous Control	—Unverified	0
ARC -- Actor Residual Critic for Adversarial Imitation Learning	Jun 5, 2022	ARCcontinuous-control	—Unverified	0
Posterior Coreset Construction with Kernelized Stein Discrepancy for Model-Based Reinforcement Learning	Jun 2, 2022	continuous-controlContinuous Control	—Unverified	0
Minimax Optimal Online Imitation Learning via Replay Estimation	May 30, 2022	continuous-controlContinuous Control	CodeCode Available	0
TaSIL: Taylor Series Imitation Learning	May 30, 2022	continuous-controlContinuous Control	CodeCode Available	0
RLx2: Training a Sparse Deep Reinforcement Learning Model from Scratch	May 30, 2022	Continuous ControlDeep Reinforcement Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 9 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified