Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 1161 papers

Title	Date	Tasks	Status	Hype
The Definitive Guide to Policy Gradients in Deep Reinforcement Learning: Theory, Algorithms and Implementations	Jan 24, 2024	continuous-controlContinuous Control	CodeCode Available	1
Pulse Width Modulation Method Applied to Nonlinear Model Predictive Control on an Under-actuated Small Satellite	Jan 21, 2024	continuous-controlContinuous Control	—Unverified	0
Reconciling Spatial and Temporal Abstractions for Goal Representation	Jan 18, 2024	continuous-controlContinuous Control	CodeCode Available	0
Identifying Policy Gradient Subspaces	Jan 12, 2024	continuous-controlContinuous Control	—Unverified	0
The Distributional Reward Critic Framework for Reinforcement Learning Under Perturbed Rewards	Jan 11, 2024	continuous-controlContinuous Control	CodeCode Available	0
A Minimaximalist Approach to Reinforcement Learning from Human Feedback	Jan 8, 2024	continuous-controlContinuous Control	—Unverified	0
Trajectory-Oriented Policy Optimization with Sparse Rewards	Jan 4, 2024	continuous-controlContinuous Control	—Unverified	0
Adversarially Trained Weighted Actor-Critic for Safe Offline Reinforcement Learning	Jan 1, 2024	continuous-controlContinuous Control	—Unverified	0
Agnostic Interactive Imitation Learning: New Theory and Practical Algorithms	Dec 28, 2023	continuous-controlContinuous Control	CodeCode Available	0
REBEL: Reward Regularization-Based Approach for Robotic Reinforcement Learning from Human Feedback	Dec 22, 2023	Bilevel Optimizationcontinuous-control	—Unverified	0
OVD-Explorer: Optimism Should Not Be the Sole Pursuit of Exploration in Noisy Environments	Dec 19, 2023	continuous-controlContinuous Control	—Unverified	0
Analyzing Generalization in Policy Networks: A Case Study with the Double-Integrator System	Dec 16, 2023	continuous-controlContinuous Control	CodeCode Available	0
Risk-Aware Continuous Control with Neural Contextual Bandits	Dec 15, 2023	continuous-controlContinuous Control	CodeCode Available	0
World Models via Policy-Guided Trajectory Diffusion	Dec 13, 2023	continuous-controlContinuous Control	CodeCode Available	1
Decoupling Meta-Reinforcement Learning with Gaussian Task Contexts and Skills	Dec 11, 2023	continuous-controlContinuous Control	CodeCode Available	0
Synergizing Quality-Diversity with Descriptor-Conditioned Reinforcement Learning	Dec 10, 2023	Continuous ControlDiversity	CodeCode Available	0
A Q-learning approach to the continuous control problem of robot inverted pendulum balancing	Dec 5, 2023	continuous-controlContinuous Control	—Unverified	0
RLIF: Interactive Imitation Learning as Reinforcement Learning	Nov 21, 2023	continuous-controlContinuous Control	—Unverified	0
Visual tracking brain computer interface	Nov 21, 2023	Brain Computer Interfacecontinuous-control	—Unverified	0
An advantage based policy transfer algorithm for reinforcement learning with measures of transferability	Nov 12, 2023	continuous-controlContinuous Control	—Unverified	0
An Intelligent Social Learning-based Optimization Strategy for Black-box Robotic Control with Reinforcement Learning	Nov 11, 2023	continuous-controlContinuous Control	—Unverified	0
Real-Time Recurrent Reinforcement Learning	Nov 8, 2023	continuous-controlContinuous Control	—Unverified	0
Time-Efficient Reinforcement Learning with Stochastic Stateful Policies	Nov 7, 2023	continuous-controlContinuous Control	—Unverified	0
Imitation Bootstrapped Reinforcement Learning	Nov 3, 2023	Continuous ControlImitation Learning	—Unverified	0
Mix-ME: Quality-Diversity for Multi-Agent Learning	Nov 3, 2023	continuous-controlContinuous Control	—Unverified	0
Learning to Discover Skills through Guidance	Oct 31, 2023	continuous-controlContinuous Control	—Unverified	0
DrM: Mastering Visual Reinforcement Learning through Dormant Ratio Minimization	Oct 30, 2023	continuous-controlContinuous Control	CodeCode Available	1
TD-MPC2: Scalable, Robust World Models for Continuous Control	Oct 25, 2023	continuous-controlContinuous Control	CodeCode Available	2
Mind the Model, Not the Agent: The Primacy Bias in Model-based RL	Oct 23, 2023	continuous-controlContinuous Control	—Unverified	0
Absolute Policy Optimization	Oct 20, 2023	Atari Gamescontinuous-control	CodeCode Available	0
Analysis of potential flow networks: Variations in transport time with discrete, continuous, and selfish operation	Oct 17, 2023	continuous-controlContinuous Control	—Unverified	0
Keep Various Trajectories: Promoting Exploration of Ensemble Policies in Continuous Control	Oct 17, 2023	continuous-controlContinuous Control	—Unverified	0
Butterfly Effects of SGD Noise: Error Amplification in Behavior Cloning and Autoregression	Oct 17, 2023	continuous-controlContinuous Control	—Unverified	0
Reduced Policy Optimization for Continuous Control with Hard Constraints	Oct 14, 2023	continuous-controlContinuous Control	CodeCode Available	1
Cross-Episodic Curriculum for Transformer Agents	Oct 12, 2023	continuous-controlContinuous Control	—Unverified	0
COPlanner: Plan to Roll Out Conservatively but to Explore Optimistically for Model-Based RL	Oct 11, 2023	continuous-controlContinuous Control	—Unverified	0
Boosting Continuous Control with Consistency Policy	Oct 10, 2023	continuous-controlContinuous Control	CodeCode Available	1
Planning to Go Out-of-Distribution in Offline-to-Online Reinforcement Learning	Oct 9, 2023	continuous-controlContinuous Control	—Unverified	0
Improving Reinforcement Learning Efficiency with Auxiliary Tasks in Non-Visual Environments: A Comparison	Oct 6, 2023	Continuous Controlreinforcement-learning	—Unverified	0
Imitation Learning from Observation through Optimal Transport	Oct 2, 2023	continuous-controlContinuous Control	—Unverified	0
Improving Emotional Expression and Cohesion in Image-Based Playlist Description and Music Topics: A Continuous Parameterization Approach	Oct 2, 2023	continuous-controlContinuous Control	—Unverified	0
Policy Optimization in a Noisy Neighborhood: On Return Landscapes in Continuous Control	Sep 26, 2023	continuous-controlContinuous Control	CodeCode Available	0
ODE-based Recurrent Model-free Reinforcement Learning for POMDPs	Sep 25, 2023	continuous-controlContinuous Control	—Unverified	0
Emergent Communication in Multi-Agent Reinforcement Learning for Future Wireless Networks	Sep 12, 2023	Autonomous Drivingcontinuous-control	—Unverified	0
Learning Shared Safety Constraints from Multi-task Demonstrations	Sep 1, 2023	continuous-controlContinuous Control	CodeCode Available	1
Bearing-based Formation with Disturbance Rejection	Aug 29, 2023	continuous-controlContinuous Control	—Unverified	0
Stabilizing Unsupervised Environment Design with a Learned Adversary	Aug 21, 2023	Car Racingcontinuous-control	CodeCode Available	0
Soft Decomposed Policy-Critic: Bridging the Gap for Effective Continuous Control with Discrete RL	Aug 20, 2023	Atari Gamescontinuous-control	—Unverified	0
ACRE: Actor-Critic with Reward-Preserving Exploration	Aug 14, 2023	continuous-controlContinuous Control	CodeCode Available	0
Value-Distributional Model-Based Reinforcement Learning	Aug 12, 2023	continuous-controlContinuous Control	CodeCode Available	0

Show:10 25 50

← PrevPage 5 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified