Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 1161 papers

Title	Date	Tasks	Status	Hype
Diminishing Return of Value Expansion Methods in Model-Based Reinforcement Learning	Mar 7, 2023	continuous-controlContinuous Control	CodeCode Available	1
MAESTRO: Open-Ended Environment Design for Multi-Agent Reinforcement Learning	Mar 6, 2023	continuous-controlContinuous Control	—Unverified	0
Swim: A General-Purpose, High-Performing, and Efficient Activation Function for Locomotion Control Tasks	Mar 5, 2023	continuous-controlContinuous Control	CodeCode Available	0
Offline Imitation Learning with Suboptimal Demonstrations via Relaxed Distribution Matching	Mar 5, 2023	continuous-controlContinuous Control	—Unverified	0
CFlowNets: Continuous Control with Generative Flow Networks	Mar 4, 2023	Active Learningcontinuous-control	CodeCode Available	0
Guarded Policy Optimization with Imperfect Online Demonstrations	Mar 3, 2023	continuous-controlContinuous Control	—Unverified	0
Planning and Control of Uncertain Cooperative Mobile Manipulator-Endowed Systems under Temporal-Logic Tasks	Mar 2, 2023	continuous-controlContinuous Control	—Unverified	0
Resource-Constrained Station-Keeping for Helium Balloons using Reinforcement Learning	Mar 2, 2023	continuous-controlContinuous Control	—Unverified	0
Hallucinated Adversarial Control for Conservative Offline Policy Evaluation	Mar 2, 2023	continuous-controlContinuous Control	CodeCode Available	0
LS-IQ: Implicit Reward Regularization for Inverse Reinforcement Learning	Mar 1, 2023	Continuous ControlImitation Learning	CodeCode Available	1
Auxiliary Task-based Deep Reinforcement Learning for Quantum Control	Feb 28, 2023	continuous-controlContinuous Control	—Unverified	0
CrystalBox: Future-Based Explanations for Input-Driven Deep RL Systems	Feb 27, 2023	continuous-controlContinuous Control	CodeCode Available	0
Continuous descriptor-based control for deep audio synthesis	Feb 27, 2023	Audio Synthesiscontinuous-control	CodeCode Available	1
Diffusion Model-Augmented Behavioral Cloning	Feb 26, 2023	continuous-controlContinuous Control	—Unverified	0
Model-Based Uncertainty in Value Functions	Feb 24, 2023	continuous-controlContinuous Control	CodeCode Available	1
To the Noise and Back: Diffusion for Shared Autonomy	Feb 23, 2023	continuous-controlContinuous Control	—Unverified	0
Universal Morphology Control via Contextual Modulation	Feb 22, 2023	continuous-controlContinuous Control	CodeCode Available	1
Improving Deep Policy Gradients with Value Function Search	Feb 20, 2023	continuous-controlContinuous Control	—Unverified	0
When Demonstrations Meet Generative World Models: A Maximum Likelihood Framework for Offline Inverse Reinforcement Learning	Feb 15, 2023	Autonomous Drivingcontinuous-control	CodeCode Available	1
CLARE: Conservative Model-Based Reward Learning for Offline Inverse Reinforcement Learning	Feb 9, 2023	continuous-controlContinuous Control	—Unverified	0
Zero-shot Sim2Real Adaptation Across Environments	Feb 8, 2023	continuous-controlContinuous Control	—Unverified	0
Attacking Cooperative Multi-Agent Reinforcement Learning by Adversarial Minority Influence	Feb 7, 2023	Continuous ControlMuJoCo	CodeCode Available	1
A Strong Baseline for Batch Imitation Learning	Feb 6, 2023	continuous-controlContinuous Control	—Unverified	0
ReLOAD: Reinforcement Learning with Optimistic Ascent-Descent for Last-Iterate Convergence in Constrained MDPs	Feb 2, 2023	continuous-controlContinuous Control	—Unverified	0
Optimal Transport Perturbations for Safe Reinforcement Learning with Robustness Guarantees	Jan 31, 2023	continuous-controlContinuous Control	CodeCode Available	1
Revisiting Estimation Bias in Policy Gradients for Deep Reinforcement Learning	Jan 20, 2023	continuous-controlContinuous Control	—Unverified	0
On The Fragility of Learned Reward Functions	Jan 9, 2023	continuous-controlContinuous Control	—Unverified	0
Centralized Cooperative Exploration Policy for Continuous Control Tasks	Jan 6, 2023	continuous-controlContinuous Control	CodeCode Available	0
Learning Goal-Conditioned Policies Offline with Self-Supervised Reward Shaping	Jan 5, 2023	continuous-controlContinuous Control	CodeCode Available	1
Robust Control for Dynamical Systems With Non-Gaussian Noise via Formal Abstractions	Jan 4, 2023	continuous-controlContinuous Control	CodeCode Available	0
Imitation Learning As State Matching via Differentiable Physics	Jan 1, 2023	continuous-controlContinuous Control	—Unverified	0
Offline Policy Optimization in RL with Variance Regularizaton	Dec 29, 2022	continuous-controlContinuous Control	—Unverified	0
Invariance to Quantile Selection in Distributional Continuous Control	Dec 29, 2022	continuous-controlContinuous Control	—Unverified	0
Temporally Layered Architecture for Adaptive, Distributed and Continuous Control	Dec 25, 2022	continuous-controlContinuous Control	—Unverified	0
Variational Quantum Soft Actor-Critic for Robotic Arm Control	Dec 20, 2022	continuous-controlContinuous Control	—Unverified	0
Managing Temporal Resolution in Continuous Value Estimation: A Fundamental Trade-off	Dec 17, 2022	continuous-controlContinuous Control	—Unverified	0
A Simple Decentralized Cross-Entropy Method	Dec 16, 2022	continuous-controlContinuous Control	CodeCode Available	0
Robust Policy Optimization in Deep Reinforcement Learning	Dec 14, 2022	continuous-controlContinuous Control	CodeCode Available	0
PPO-UE: Proximal Policy Optimization via Uncertainty-Aware Exploration	Dec 13, 2022	continuous-controlContinuous Control	—Unverified	0
On the Sensitivity of Reward Inference to Misspecified Human Models	Dec 9, 2022	continuous-controlContinuous Control	—Unverified	0
Accelerating Self-Imitation Learning from Demonstrations via Policy Constraints and Q-Ensemble	Dec 7, 2022	continuous-controlContinuous Control	—Unverified	0
First Go, then Post-Explore: the Benefits of Post-Exploration in Intrinsic Motivation	Dec 6, 2022	continuous-controlContinuous Control	—Unverified	0
Dynamic Decision Frequency with Continuous Options	Dec 6, 2022	continuous-controlContinuous Control	CodeCode Available	0
Q-Pensieve: Boosting Sample Efficiency of Multi-Objective RL Through Memory Sharing of Q-Snapshots	Dec 6, 2022	continuous-controlContinuous Control	CodeCode Available	0
Policy Learning for Active Target Tracking over Continuous SE(3) Trajectories	Dec 3, 2022	continuous-controlContinuous Control	CodeCode Available	1
STL-Based Synthesis of Feedback Controllers Using Reinforcement Learning	Dec 2, 2022	continuous-controlContinuous Control	CodeCode Available	0
Quadratic Programming for Continuous Control of Safety-Critical Multi-Agent Systems Under Uncertainty	Nov 30, 2022	Collision Avoidancecontinuous-control	—Unverified	0
Continuous Neural Algorithmic Planners	Nov 29, 2022	continuous-controlContinuous Control	—Unverified	0
Learning from Good Trajectories in Offline Multi-Agent Reinforcement Learning	Nov 28, 2022	continuous-controlContinuous Control	—Unverified	0
Hypernetworks for Zero-shot Transfer in Reinforcement Learning	Nov 28, 2022	continuous-controlContinuous Control	—Unverified	0

Show:10 25 50

← PrevPage 7 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified