Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13051–13100 of 15113 papers

Title	Date	Tasks	Status	Hype
Decentralized Computation Offloading for Multi-User Mobile Edge Computing: A Deep Reinforcement Learning Approach	Dec 16, 2018	Deep Reinforcement LearningEdge-computing	CodeCode Available	0
Likelihood Quantile Networks for Coordinating Multi-Agent Reinforcement Learning	Dec 15, 2018	Multi-agent Reinforcement LearningPhilosophy	—Unverified	0
Residual Policy Learning	Dec 15, 2018	Deep Reinforcement LearningMuJoCo	CodeCode Available	0
Simulation to Scaled City: Zero-Shot Policy Transfer for Traffic Control via Autonomous Vehicles	Dec 14, 2018	Autonomous VehiclesDeep Reinforcement Learning	CodeCode Available	2
Scaling shared model governance via model splitting	Dec 14, 2018	Deep Learningmodel	—Unverified	0
Dopamine: A Research Framework for Deep Reinforcement Learning	Dec 14, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	3
Guaranteed satisficing and finite regret: Analysis of a cognitive satisficing value function	Dec 14, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Learning to Communicate: A Machine Learning Framework for Heterogeneous Multi-Agent Robotic Systems	Dec 13, 2018	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
IRLAS: Inverse Reinforcement Learning for Architecture Search	Dec 13, 2018	Neural Architecture Searchreinforcement-learning	CodeCode Available	0
Exploration Conscious Reinforcement Learning Revisited	Dec 13, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Soft Actor-Critic Algorithms and Applications	Dec 13, 2018	Decision Makingreinforcement-learning	CodeCode Available	1
A predictive safety filter for learning-based control of constrained nonlinear dynamical systems	Dec 13, 2018	Model Predictive ControlReinforcement Learning	—Unverified	0
KF-LAX: Kronecker-factored curvature estimation for control variate optimization in reinforcement learning	Dec 11, 2018	Atari Gamesreinforcement-learning	—Unverified	0
Efficient Model-Free Reinforcement Learning Using Gaussian Process	Dec 11, 2018	modelreinforcement-learning	—Unverified	0
Dialogue Generation: From Imitation Learning to Inverse Reinforcement Learning	Dec 9, 2018	Dialogue GenerationImitation Learning	CodeCode Available	0
The Gap Between Model-Based and Model-Free Methods on the Linear Quadratic Regulator: An Asymptotic Viewpoint	Dec 9, 2018	continuous-controlContinuous Control	—Unverified	0
Learning Montezuma's Revenge from a Single Demonstration	Dec 8, 2018	Montezuma's Revengereinforcement-learning	—Unverified	0
Communication-Efficient Policy Gradient Methods for Distributed Reinforcement Learning	Dec 7, 2018	Distributed ComputingMulti-agent Reinforcement Learning	—Unverified	0
Residual Reinforcement Learning for Robot Control	Dec 7, 2018	Frictionreinforcement-learning	—Unverified	0
Off-Policy Deep Reinforcement Learning without Exploration	Dec 7, 2018	continuous-controlContinuous Control	CodeCode Available	1
Measuring and Characterizing Generalization in Deep Reinforcement Learning	Dec 7, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Pseudo-Rehearsal: Achieving Deep Reinforcement Learning without Catastrophic Forgetting	Dec 6, 2018	Atari GamesContinual Learning	CodeCode Available	0
Quantifying Generalization in Reinforcement Learning	Dec 6, 2018	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1
ToyBox: Better Atari Environments for Testing Reinforcement Learning Agents	Dec 6, 2018	Atari Gamesreinforcement-learning	CodeCode Available	0
Deep Reinforcement Learning and the Deadly Triad	Dec 6, 2018	Deep Reinforcement LearningLearning Theory	—Unverified	0
Active Deep Q-learning with Demonstration	Dec 6, 2018	Q-Learningreinforcement-learning	—Unverified	0
Finite-Sample Analysis For Decentralized Batch Multi-Agent Reinforcement Learning With Networked Agents	Dec 6, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Adapting Auxiliary Losses Using Gradient Similarity	Dec 5, 2018	Atari Gamesreinforcement-learning	—Unverified	0
Composing Entropic Policies using Divergence Correction	Dec 5, 2018	continuous-controlContinuous Control	—Unverified	0
The effects of negative adaptation in Model-Agnostic Meta-Learning	Dec 5, 2018	Few-Shot LearningMeta-Learning	—Unverified	0
Relative Entropy Regularized Policy Iteration	Dec 5, 2018	continuous-controlContinuous Control	CodeCode Available	0
Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning	Dec 4, 2018	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	0
Exploration versus exploitation in reinforcement learning: a stochastic control approach	Dec 4, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Hyperbolic Embeddings for Learning Options in Hierarchical Reinforcement Learning	Dec 4, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Learning Vine Copula Models For Synthetic Data Generation	Dec 4, 2018	Model SelectionReinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Intelligent Transportation Systems	Dec 3, 2018	Deep Reinforcement LearningManagement	—Unverified	0
FoldingZero: Protein Folding from Scratch in Hydrophobic-Polar Model	Dec 3, 2018	Deep Reinforcement LearningProtein Folding	—Unverified	0
Generative Adversarial Self-Imitation Learning	Dec 3, 2018	Imitation LearningMuJoCo	—Unverified	0
Bach2Bach: Generating Music Using A Deep Reinforcement Learning Approach	Dec 3, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Towards Solving Text-based Games by Producing Adaptive Action Spaces	Dec 3, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Visual Foresight: Model-Based Deep Reinforcement Learning for Vision-Based Robotic Control	Dec 3, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Resource Constrained Deep Reinforcement Learning	Dec 3, 2018	Deep Reinforcement LearningManagement	—Unverified	0
Multi-agent Deep Reinforcement Learning with Extremely Noisy Observations	Dec 3, 2018	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Mitigating Planner Overfitting in Model-Based Reinforcement Learning	Dec 3, 2018	modelModel-based Reinforcement Learning	—Unverified	0
Revisiting the Softmax Bellman Operator: New Benefits and New Perspective	Dec 2, 2018	Atari GamesQ-Learning	CodeCode Available	0
Macro action selection with deep reinforcement learning in StarCraft	Dec 2, 2018	Deep Reinforcement LearningReal-Time Strategy Games	CodeCode Available	0
Reinforcement Learning with Multiple Experts: A Bayesian Model Combination Approach	Dec 1, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Simple random search of static linear policies is competitive for reinforcement learning	Dec 1, 2018	continuous-controlContinuous Control	CodeCode Available	0
REFUEL: Exploring Sparse Features in Deep Reinforcement Learning for Fast Disease Diagnosis	Dec 1, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Multiple-Step Greedy Policies in Approximate and Online Reinforcement Learning	Dec 1, 2018	Model Predictive Controlreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 262 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified