Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14501–14550 of 15113 papers

Title	Date	Tasks	Status	Hype
Exploration--Exploitation in MDPs with Options	Mar 25, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Cohesion-based Online Actor-Critic Reinforcement Learning for mHealth Intervention	Mar 25, 2017	Decision Makingreinforcement-learning	—Unverified	0
Unsupervised Basis Function Adaptation for Reinforcement Learning	Mar 23, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Fake News Mitigation via Point Process Based Intervention	Mar 22, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Faster Reinforcement Learning Using Active Simulators	Mar 22, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Unifying PAC and Regret: Uniform PAC Bounds for Episodic Reinforcement Learning	Mar 22, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Deep Exploration via Randomized Value Functions	Mar 22, 2017	Efficient Explorationreinforcement-learning	—Unverified	0
Investigation of Language Understanding Impact for Reinforcement Learning Based Dialogue Systems	Mar 21, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Pseudorehearsal in value function approximation	Mar 21, 2017	Q-Learningreinforcement-learning	—Unverified	0
Black-Box Data-efficient Policy Search for Robotics	Mar 21, 2017	Continuous ControlReinforcement Learning	CodeCode Available	0
Learning Cooperative Visual Dialog Agents with Deep Reinforcement Learning	Mar 20, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Multi-Timescale, Gradient Descent, Temporal Difference Learning with Linear Options	Mar 19, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Online Learning for Offloading and Autoscaling in Energy Harvesting Mobile Edge Computing	Mar 17, 2017	Edge-computingManagement	—Unverified	0
Deep Decentralized Multi-task Multi-Agent Reinforcement Learning under Partial Observability	Mar 17, 2017	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Particle Value Functions	Mar 16, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Using Reinforcement Learning for Demand Response of Domestic Hot Water Buffers: a Real-Life Demonstration	Mar 16, 2017	Decision MakingModel-based Reinforcement Learning	—Unverified	0
Minimax Regret Bounds for Reinforcement Learning	Mar 16, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Finite Sample Analysis of Two-Timescale Stochastic Approximation with Applications to Reinforcement Learning	Mar 15, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Sensor Fusion for Robot Control through Deep Reinforcement Learning	Mar 13, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning for Transition-Based Mention Detection	Mar 13, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
A Hierarchical Framework of Cloud Resource Allocation and Power Management Using Deep Reinforcement Learning	Mar 13, 2017	Cloud ComputingDecision Making	—Unverified	0
Micro-Objective Learning : Accelerating Deep Reinforcement Learning through the Discovery of Continuous Subgoals	Mar 11, 2017	Atari GamesDeep Reinforcement Learning	—Unverified	0
Communications that Emerge through Reinforcement Learning Using a (Recurrent) Neural Network	Mar 10, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Evolution Strategies as a Scalable Alternative to Reinforcement Learning	Mar 10, 2017	Atari GamesMuJoCo	CodeCode Available	1
Sample Efficient Feature Selection for Factored MDPs	Mar 9, 2017	Allfeature selection	—Unverified	0
What can you do with a rock? Affordance extraction via word embeddings	Mar 9, 2017	Affordance DetectionReinforcement Learning	—Unverified	0
Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks	Mar 9, 2017	Category-Agnostic Pose EstimationFew-Shot Image Classification	CodeCode Available	1
Robust Adversarial Reinforcement Learning	Mar 8, 2017	Frictionreinforcement-learning	CodeCode Available	1
Tree-Structured Reinforcement Learning for Sequential Object Localization	Mar 8, 2017	DiversityObject	—Unverified	0
Learning Invariant Feature Spaces to Transfer Skills with Reinforcement Learning	Mar 8, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Variation-structured Reinforcement Learning for Visual Relationship and Attribute Detection	Mar 8, 2017	Attributeimage-classification	CodeCode Available	0
Tactics of Adversarial Attack on Deep Reinforcement Learning Agents	Mar 8, 2017	Adversarial AttackAtari Games	—Unverified	0
Functions that Emerge through End-to-End Reinforcement Learning - The Direction for Artificial General Intelligence -	Mar 7, 2017	Color ConstancyGame of Go	—Unverified	0
Neural Episodic Control	Mar 6, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Surprise-Based Intrinsic Motivation for Deep Reinforcement Learning	Mar 6, 2017	continuous-controlContinuous Control	—Unverified	0
Third-Person Imitation Learning	Mar 6, 2017	Imitation Learningreinforcement-learning	CodeCode Available	0
Unsupervised Basis Function Adaptation for Reinforcement Learning	Mar 3, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Deeply AggreVaTeD: Differentiable Imitation Learning for Sequential Prediction	Mar 3, 2017	Decision MakingDependency Parsing	—Unverified	0
FeUdal Networks for Hierarchical Reinforcement Learning	Mar 3, 2017	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	0
Generalised Discount Functions applied to a Monte-Carlo AImu Implementation	Mar 3, 2017	General Reinforcement Learningreinforcement-learning	CodeCode Available	0
Actor-Critic Reinforcement Learning with Simultaneous Human Control and Feedback	Mar 3, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
EX2: Exploration with Exemplar Models for Deep Reinforcement Learning	Mar 3, 2017	Deep Reinforcement LearningDensity Estimation	CodeCode Available	0
Multi-step Reinforcement Learning: A Unifying Algorithm	Mar 3, 2017	Q-Learningreinforcement-learning	—Unverified	0
A Laplacian Framework for Option Discovery in Reinforcement Learning	Mar 2, 2017	Atari Gamesreinforcement-learning	CodeCode Available	0
Reinforcement Learning for Pivoting Task	Mar 1, 2017	continuous-controlContinuous Control	CodeCode Available	0
Virtual-to-real Deep Reinforcement Learning: Continuous Control of Mobile Robots for Mapless Navigation	Mar 1, 2017	continuous-controlContinuous Control	CodeCode Available	1
Learning to Optimize Neural Nets	Mar 1, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Show, Attend and Interact: Perceivable Human-Robot Social Interaction through Neural Attention Q-Network	Feb 28, 2017	Deep Attentionreinforcement-learning	—Unverified	0
Analysing Congestion Problems in Multi-agent Reinforcement Learning	Feb 28, 2017	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Analysis of Agent Expertise in Ms. Pac-Man using Value-of-Information-based Policies	Feb 28, 2017	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 291 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified