Continuous Control

Continuous control in the context of playing games, especially within artificial intelligence (AI) and machine learning (ML), refers to the ability to make a series of smooth, ongoing adjustments or actions to control a game or a simulation. This is in contrast to discrete control, where the actions are limited to a set of specific, distinct choices. Continuous control is crucial in environments where precision, timing, and the magnitude of actions matter, such as driving a car in a racing game, controlling a character in a simulation, or managing the flight of an aircraft in a flight simulator.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 1161 papers

Title	Date	Tasks	Status
Relative Entropy Regularized Policy Iteration	Dec 5, 2018	continuous-controlContinuous Control	CodeCode Available
CompILE: Compositional Imitation Learning and Execution	Dec 4, 2018	continuous-controlContinuous Control	CodeCode Available
Traversing the Continuous Spectrum of Image Retrieval with Deep Dynamic Models	Dec 1, 2018	Attributecontinuous-control	—Unverified
Simple random search of static linear policies is competitive for reinforcement learning	Dec 1, 2018	continuous-controlContinuous Control	CodeCode Available
A Bayesian Approach to Generative Adversarial Imitation Learning	Dec 1, 2018	continuous-controlContinuous Control	—Unverified
Taking Control of Intra-class Variation in Conditional GANs Under Weak Supervision	Nov 27, 2018	AttributeContinuous Control	—Unverified
PNS: Population-Guided Novelty Search for Reinforcement Learning in Hard Exploration Environments	Nov 26, 2018	continuous-controlContinuous Control	—Unverified
Model Learning for Look-ahead Exploration in Continuous Control	Nov 20, 2018	continuous-controlContinuous Control	CodeCode Available
Mapping Navigation Instructions to Continuous Control Actions with Position-Visitation Prediction	Nov 10, 2018	continuous-controlContinuous Control	CodeCode Available
Meta-Learning for Multi-objective Reinforcement Learning	Nov 8, 2018	Computational Efficiencycontinuous-control	—Unverified
ACE: An Actor Ensemble Algorithm for Continuous Control with Tree Search	Nov 6, 2018	continuous-controlContinuous Control	—Unverified
Deep Intrinsically Motivated Continuous Actor-Critic for Efficient Robotic Visuomotor Skill Learning	Oct 26, 2018	continuous-controlContinuous Control	—Unverified
Inverse reinforcement learning for video games	Oct 24, 2018	continuous-controlContinuous Control	CodeCode Available
Using Deep Reinforcement Learning for the Continuous Control of Robotic Arms	Oct 15, 2018	continuous-controlContinuous Control	—Unverified
PPO-CMA: Proximal Policy Optimization with Covariance Matrix Adaptation	Oct 5, 2018	continuous-controlContinuous Control	CodeCode Available
Where Did My Optimum Go?: An Empirical Analysis of Gradient Descent Optimization in Policy Gradient Methods	Oct 5, 2018	continuous-controlContinuous Control	CodeCode Available
EMI: Exploration with Mutual Information	Oct 2, 2018	continuous-controlContinuous Control	CodeCode Available
Near-Optimal Representation Learning for Hierarchical Reinforcement Learning	Oct 2, 2018	2D Human Pose Estimationcontinuous-control	CodeCode Available
Variational Discriminator Bottleneck: Improving Imitation Learning, Inverse RL, and GANs by Constraining Information Flow	Oct 1, 2018	continuous-controlContinuous Control	CodeCode Available
Where Off-Policy Deep Reinforcement Learning Fails	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
EMI: Exploration with Mutual Information Maximizing State and Action Embeddings	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
Improving Generative Adversarial Imitation Learning with Non-expert Demonstrations	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
Success at any cost: value constrained model-free continuous control	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
Shrinkage-based Bias-Variance Trade-off for Deep Reinforcement Learning	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
Transfer Value or Policy? A Value-centric Framework Towards Transferrable Continuous Reinforcement Learning	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
Benchmarking Reinforcement Learning Algorithms on Real-World Robots	Sep 20, 2018	Benchmarkingcontinuous-control	CodeCode Available
Policy Optimization via Importance Sampling	Sep 17, 2018	continuous-controlContinuous Control	CodeCode Available
Sample-Efficient Imitation Learning via Generative Adversarial Nets	Sep 6, 2018	continuous-controlContinuous Control	CodeCode Available
ARCHER: Aggressive Rewards to Counter bias in Hindsight Experience Replay	Sep 6, 2018	continuous-controlContinuous Control	CodeCode Available
Structured Neural Network Dynamics for Model-based Control	Aug 3, 2018	continuous-controlContinuous Control	—Unverified
Learning Actionable Representations from Visual Observations	Aug 2, 2018	continuous-controlContinuous Control	—Unverified
Learning Stabilizable Dynamical Systems via Control Contraction Metrics	Jul 31, 2018	continuous-controlContinuous Control	—Unverified
Doubly Stochastic Adversarial Autoencoder	Jul 19, 2018	continuous-controlContinuous Control	—Unverified
General Value Function Networks	Jul 18, 2018	Continuous ControlDecision Making	—Unverified
Deterministic Policy Gradients With General State Transitions	Jul 10, 2018	continuous-controlContinuous Control	—Unverified
Algorithmic Framework for Model-based Deep Reinforcement Learning with Theoretical Guarantees	Jul 10, 2018	continuous-controlContinuous Control	CodeCode Available
Sample-Efficient Reinforcement Learning with Stochastic Ensemble Value Expansion	Jul 4, 2018	continuous-controlContinuous Control	—Unverified
Learning to Explore via Meta-Policy Gradient	Jul 1, 2018	continuous-controlContinuous Control	—Unverified
Multi-objective Model-based Policy Search for Data-efficient Learning with Sparse Rewards	Jun 25, 2018	Continuous ControlEfficient Exploration	CodeCode Available
A Tour of Reinforcement Learning: The View from Continuous Control	Jun 25, 2018	continuous-controlContinuous Control	CodeCode Available
Learning Policy Representations in Multiagent Systems	Jun 17, 2018	Clusteringcontinuous-control	—Unverified
BaRC: Backward Reachability Curriculum for Robotic Reinforcement Learning	Jun 16, 2018	continuous-controlContinuous Control	CodeCode Available
Marginal Policy Gradients: A Unified Family of Estimators for Bounded Action Spaces with Applications	Jun 13, 2018	continuous-controlContinuous Control	CodeCode Available
Variational Inverse Control with Events: A General Framework for Data-Driven Reward Definition	May 29, 2018	continuous-controlContinuous Control	—Unverified
Dual Policy Iteration	May 28, 2018	continuous-controlContinuous Control	—Unverified
Fingerprint Policy Optimisation for Robust Reinforcement Learning	May 27, 2018	Bayesian OptimisationContinuous Control	—Unverified
Learning Self-Imitating Diverse Policies	May 25, 2018	continuous-controlContinuous Control	—Unverified
Evolution-Guided Policy Gradient in Reinforcement Learning	May 21, 2018	continuous-controlContinuous Control	CodeCode Available
Policy Optimization with Second-Order Advantage Information	May 9, 2018	continuous-controlContinuous Control	CodeCode Available
Distributed Distributional Deterministic Policy Gradients	Apr 23, 2018	continuous-controlContinuous Control	CodeCode Available

Show:10 25 50

← PrevPage 22 of 24Next →

All datasets PyBullet Ant PyBullet HalfCheetah PyBullet Hopper PyBullet Walker2D DeepMind Cheetah Run (Images)cartpole.balance_sparse cartpole.swingup cheetah.run DeepMind Cup Catch (Images)DeepMind Walker Walk (Images)finger.turn_hard walker.stand

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	3,459	—	Unverified
2	TD3 gSDE	Return	3,267	—	Unverified
3	TD3	Return	2,865	—	Unverified
4	SAC	Return	2,859	—	Unverified
5	PPO gSDE	Return	2,587	—	Unverified
6	A2C gSDE	Return	2,560	—	Unverified
7	PPO	Return	2,160	—	Unverified
8	A2C	Return	1,967	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC	Return	2,883	—	Unverified
2	SAC gSDE	Return	2,850	—	Unverified
3	PPO + gSDE	Return	2,760	—	Unverified
4	TD3	Return	2,687	—	Unverified
5	TD3 gSDE	Return	2,578	—	Unverified
6	PPO	Return	2,254	—	Unverified
7	A2C + gSDE	Return	2,028	—	Unverified
8	A2C	Return	1,652	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,646	—	Unverified
2	PPO gSDE	Return	2,508	—	Unverified
3	SAC	Return	2,477	—	Unverified
4	TD3	Return	2,470	—	Unverified
5	TD3 gSDE	Return	2,353	—	Unverified
6	PPO	Return	1,622	—	Unverified
7	A2C	Return	1,559	—	Unverified
8	A2C gSDE	Return	1,448	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SAC gSDE	Return	2,341	—	Unverified
2	SAC	Return	2,215	—	Unverified
3	TD3	Return	2,106	—	Unverified
4	TD3 gSDE	Return	1,989	—	Unverified
5	PPO gSDE	Return	1,776	—	Unverified
6	PPO	Return	1,238	—	Unverified
7	A2C gSDE	Return	694	—	Unverified
8	A2C	Return	443	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DreamerV1	Return	800	—	Unverified
2	SLAC	Return	700	—	Unverified
3	DrQ	Return	660	—	Unverified
4	PlaNet	Return	650	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	998.14	—	Unverified
2	DREAMER	Return	853	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	868.87	—	Unverified
2	MuZero Unplugged	Return	594.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	914.39	—	Unverified
2	MuZero Unplugged	Return	869.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	963	—	Unverified
2	PlaNet	Return	914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQ	Return	921	—	Unverified
2	PlaNet	Return	890	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	963.07	—	Unverified
2	MuZero Unplugged	Return	759	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	987.79	—	Unverified
2	MuZero Unplugged	Return	887.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	975.46	—	Unverified
2	MuZero Unplugged	Return	949.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,353.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-326	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-83.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-149.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	417.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-170.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	730.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-0.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	977.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	769	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	959	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	984.86	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,869.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	960.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	606.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	980.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	178.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	582	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	841	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	846.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	299	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	518	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4,412.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	986.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	767	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	926	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	972.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	681.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	287	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,914	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	1,183.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	528.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	926.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	643.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	247.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	4.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	10.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	14.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAC	Score	163.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	659.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MuZero Unplugged	Return	556	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-64.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-60.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	-61.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	837.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	923.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	933.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	982.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	538	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	929	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	971.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	269.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TRPO	Score	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMuZero	Return	931.06	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	403	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CURL	Score	902	—	Unverified