Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 1161 papers

Title	Date	Tasks	Status	Hype
QDax: A Library for Quality-Diversity and Population-based Algorithms with Hardware Acceleration	Aug 7, 2023	continuous-controlContinuous Control	CodeCode Available	0
Theoretically Guaranteed Policy Improvement Distilled from Model-Based Planning	Jul 24, 2023	continuous-controlContinuous Control	—Unverified	0
Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs	Jul 22, 2023	continuous-controlContinuous Control	CodeCode Available	0
Game-Theoretic Robust Reinforcement Learning Handles Temporally-Coupled Perturbations	Jul 22, 2023	continuous-controlContinuous Control	—Unverified	0
Exploring reinforcement learning techniques for discrete and continuous control tasks in the MuJoCo environment	Jul 20, 2023	continuous-controlContinuous Control	CodeCode Available	0
PottsMGNet: A Mathematical Explanation of Encoder-Decoder Based Neural Networks	Jul 18, 2023	continuous-controlContinuous Control	—Unverified	0
Diagnosis, Feedback, Adaptation: A Human-in-the-Loop Framework for Test-Time Policy Adaptation	Jul 12, 2023	continuous-controlContinuous Control	—Unverified	0
Diffusion Policies for Out-of-Distribution Generalization in Offline Reinforcement Learning	Jul 10, 2023	continuous-controlContinuous Control	—Unverified	0
SAR: Generalization of Physiological Agility and Dexterity via Synergistic Action Representation	Jul 7, 2023	continuous-controlContinuous Control	—Unverified	0
λ-models: Effective Decision-Aware Reinforcement Learning with Latent Models	Jun 30, 2023	continuous-controlContinuous Control	—Unverified	0
Provably Convergent Policy Optimization via Metric-aware Trust Region Methods	Jun 25, 2023	continuous-controlContinuous Control	—Unverified	0
Safe Reinforcement Learning with Dead-Ends Avoidance and Recovery	Jun 24, 2023	continuous-controlContinuous Control	—Unverified	0
TACO: Temporal Latent Action-Driven Contrastive Loss for Visual Reinforcement Learning	Jun 22, 2023	continuous-controlContinuous Control	CodeCode Available	1
PACER: A Fully Push-forward-based Distributional Reinforcement Learning Algorithm	Jun 11, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified	0
Value function estimation using conditional diffusion models for control	Jun 9, 2023	continuous-controlContinuous Control	—Unverified	0
RLtools: A Fast, Portable Deep Reinforcement Learning Library for Continuous Control	Jun 6, 2023	continuous-controlContinuous Control	CodeCode Available	2
Seizing Serendipity: Exploiting the Value of Past Success in Off-Policy Actor-Critic	Jun 5, 2023	continuous-controlContinuous Control	CodeCode Available	1
For SALE: State-Action Representation Learning for Deep Reinforcement Learning	Jun 4, 2023	continuous-controlContinuous Control	CodeCode Available	1
ReLU to the Rescue: Improve Your On-Policy Actor-Critic with Positive Advantages	Jun 2, 2023	Bayesian Inferencecontinuous-control	CodeCode Available	0
ROSARL: Reward-Only Safe Reinforcement Learning	May 31, 2023	continuous-controlContinuous Control	CodeCode Available	0
Optimizing Attention and Cognitive Control Costs Using Temporally-Layered Architectures	May 30, 2023	continuous-controlContinuous Control	CodeCode Available	0
Off-Policy RL Algorithms Can be Sample-Efficient for Continuous Control via Sample Multiple Reuse	May 29, 2023	continuous-controlContinuous Control	CodeCode Available	0
Reinforcement Learning with Simple Sequence Priors	May 26, 2023	continuous-controlContinuous Control	—Unverified	0
Shape-based pose estimation for automatic standard views of the knee	May 26, 2023	Anatomycontinuous-control	—Unverified	0
Distributional Reinforcement Learning with Dual Expectile-Quantile Regression	May 26, 2023	Continuous ControlDistributional Reinforcement Learning	—Unverified	0
Conditional Mutual Information for Disentangled Representations in Reinforcement Learning	May 23, 2023	continuous-controlContinuous Control	CodeCode Available	1
Policy Representation via Diffusion Probability Model for Reinforcement Learning	May 22, 2023	continuous-controlContinuous Control	CodeCode Available	1
Dive into the Power of Neuronal Heterogeneity	May 19, 2023	continuous-controlContinuous Control	—Unverified	0
Policy Gradient Methods in the Presence of Symmetries and State Abstractions	May 9, 2023	continuous-controlContinuous Control	CodeCode Available	1
Sense, Imagine, Act: Multimodal Perception Improves Model-Based Reinforcement Learning for Head-to-Head Autonomous Racing	May 8, 2023	Autonomous Racingcontinuous-control	—Unverified	0
Behavior Contrastive Learning for Unsupervised Skill Discovery	May 8, 2023	continuous-controlContinuous Control	CodeCode Available	1
Explaining RL Decisions with Trajectories	May 6, 2023	Attributecontinuous-control	CodeCode Available	0
Robust Model Predictive Techno-Economic Control of Active Distribution Networks	May 5, 2023	continuous-controlContinuous Control	—Unverified	0
Federated Ensemble-Directed Offline Reinforcement Learning	May 4, 2023	continuous-controlContinuous Control	CodeCode Available	1
Masked Trajectory Models for Prediction, Representation, and Control	May 4, 2023	continuous-controlContinuous Control	CodeCode Available	1
Mixed-Integer Optimal Control via Reinforcement Learning: A Case Study on Hybrid Electric Vehicle Energy Management	May 2, 2023	continuous-controlContinuous Control	CodeCode Available	0
Reinforcement Learning with Partial Parametric Model Knowledge	Apr 26, 2023	continuous-controlContinuous Control	—Unverified	0
Hierarchical State Abstraction Based on Structural Information Principles	Apr 24, 2023	continuous-controlContinuous Control	CodeCode Available	0
Multi-agent Policy Reciprocity with Theoretical Guarantee	Apr 12, 2023	continuous-controlContinuous Control	—Unverified	0
Real-Time Model-Free Deep Reinforcement Learning for Force Control of a Series Elastic Actuator	Apr 11, 2023	continuous-controlContinuous Control	—Unverified	0
UAV Obstacle Avoidance by Human-in-the-Loop Reinforcement in Arbitrary 3D Environment	Apr 7, 2023	continuous-controlContinuous Control	CodeCode Available	1
On Context Distribution Shift in Task Representation Learning for Offline Meta RL	Apr 1, 2023	continuous-controlContinuous Control	CodeCode Available	0
Inverse Reinforcement Learning without Reinforcement Learning	Mar 26, 2023	continuous-controlContinuous Control	CodeCode Available	1
Distributed Safe Control Design and Probabilistic Safety Verification for Multi-Agent Systems	Mar 22, 2023	Collision AvoidanceContinuous Control	—Unverified	0
Adaptive Policy Learning for Offline-to-Online Reinforcement Learning	Mar 14, 2023	continuous-controlContinuous Control	—Unverified	0
RE-MOVE: An Adaptive Policy Design for Robotic Navigation Tasks in Dynamic Environments via Language-Based Feedback	Mar 14, 2023	continuous-controlContinuous Control	—Unverified	0
Structured State Space Models for In-Context Reinforcement Learning	Mar 7, 2023	continuous-controlContinuous Control	CodeCode Available	1
Sample-efficient Real-time Planning with Curiosity Cross-Entropy Method and Contrastive Learning	Mar 7, 2023	continuous-controlContinuous Control	CodeCode Available	0
A Strategy-Oriented Bayesian Soft Actor-Critic Model	Mar 7, 2023	continuous-controlContinuous Control	—Unverified	0
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning	Mar 7, 2023	Continuous ControlOffline RL	—Unverified	0

Show:10 25 50

← PrevPage 6 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified