Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 15001–15050 of 15113 papers

Title	Date	Tasks	Status
Exploration in Interactive Personalized Music Recommendation: A Reinforcement Learning Approach	Nov 6, 2013	Bayesian InferenceMusic Recommendation	—Unverified
Reinforcement Learning for Matrix Computations: PageRank as an Example	Nov 1, 2013	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Framework for Opportunistic Routing in WSNs	Oct 31, 2013	reinforcement-learningReinforcement Learning	—Unverified
Distributed Reinforcement Learning via Gossip	Oct 28, 2013	reinforcement-learningReinforcement Learning	—Unverified
Sample Complexity of Multi-task Reinforcement Learning	Sep 26, 2013	reinforcement-learningReinforcement Learning	—Unverified
Temporal-Difference Learning to Assist Human Decision Making during the Control of an Artificial Limb	Sep 18, 2013	Decision MakingReinforcement Learning	—Unverified
The Sample-Complexity of General Reinforcement Learning	Aug 22, 2013	General Reinforcement Learningreinforcement-learning	—Unverified
Coevolutionary networks of reinforcement-learning agents	Aug 5, 2013	reinforcement-learningReinforcement Learning	—Unverified
Evaluating State Representations for Reinforcement Learning of Turn-Taking Policies in Tutorial Dialogue	Aug 1, 2013	Dialogue ManagementReinforcement Learning	—Unverified
Generating Student Feedback from Time-Series Data Using Reinforcement Learning	Aug 1, 2013	Data-to-Text Generationreinforcement-learning	—Unverified
Reinforcement Learning of Two-Issue Negotiation Dialogue Policies	Aug 1, 2013	Question Answeringreinforcement-learning	—Unverified
Sequential Transfer in Multi-armed Bandit with Finite Set of Models	Jul 25, 2013	Lifelong learningreinforcement-learning	—Unverified
Model-Based Policy Gradients with Parameter-Based Exploration by Least-Squares Conditional Density Estimation	Jul 19, 2013	Density EstimationReinforcement Learning	—Unverified
Efficient Reinforcement Learning in Deterministic Systems with Value Function Generalization	Jul 18, 2013	Efficient Explorationreinforcement-learning	—Unverified
Probabilistic inverse reinforcement learning in unknown environments	Jul 14, 2013	Bayesian Inferencereinforcement-learning	—Unverified
Multi-Task Policy Search	Jul 2, 2013	Imitation Learningreinforcement-learning	—Unverified
Scaling Up Robust MDPs by Reinforcement Learning	Jun 26, 2013	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement learning with restrictions on the action set	Jun 12, 2013	reinforcement-learningReinforcement Learning	—Unverified
The association problem in wireless networks: a Policy Gradient Reinforcement Learning approach	Jun 11, 2013	Q-Learningreinforcement-learning	—Unverified
Direct Uncertainty Estimation in Reinforcement Learning	Jun 6, 2013	reinforcement-learningReinforcement Learning	—Unverified
(More) Efficient Reinforcement Learning via Posterior Sampling	Jun 4, 2013	Efficient Explorationreinforcement-learning	—Unverified
Reinforcement Learning for the Soccer Dribbling Task	May 28, 2013	reinforcement-learningReinforcement Learning	—Unverified
Cover Tree Bayesian Reinforcement Learning	May 8, 2013	reinforcement-learningReinforcement Learning	—Unverified
Regret Bounds for Reinforcement Learning with Policy Advice	May 5, 2013	reinforcement-learningReinforcement Learning	—Unverified
Non Deterministic Logic Programs	Apr 26, 2013	Negationreinforcement-learning	—Unverified
A General Framework for Interacting Bayes-Optimally with Self-Interested Agents using Arbitrary Parametric Model and Model Prior	Apr 7, 2013	modelMulti-agent Reinforcement Learning	—Unverified
Model-based Bayesian Reinforcement Learning for Dialogue Management	Apr 5, 2013	Bayesian InferenceDialogue Management	—Unverified
Design for a Darwinian Brain: Part 2. Cognitive Architecture	Mar 28, 2013	Reinforcement LearningReinforcement Learning (RL)	—Unverified
ABC Reinforcement Learning	Mar 27, 2013	reinforcement-learningReinforcement Learning	—Unverified
Efficient Reinforcement Learning for High Dimensional Linear Quadratic Systems	Mar 24, 2013	reinforcement-learningReinforcement Learning	—Unverified
A Greedy Approximation of Bayesian Reinforcement Learning with Probably Optimistic Transition Model	Mar 13, 2013	reinforcement-learningReinforcement Learning	—Unverified
Toggling a Genetic Switch Using Reinforcement Learning	Mar 12, 2013	reinforcement-learningReinforcement Learning	—Unverified
Hybrid Q-Learning Applied to Ubiquitous recommender system	Mar 10, 2013	Q-LearningRecommendation Systems	—Unverified
Online Regret Bounds for Undiscounted Continuous Reinforcement Learning	Feb 11, 2013	reinforcement-learningReinforcement Learning	—Unverified
The Optimal Reward Baseline for Gradient-Based Reinforcement Learning	Jan 10, 2013	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement learning for port-Hamiltonian systems	Dec 21, 2012	reinforcement-learningReinforcement Learning	—Unverified
Weighted Likelihood Policy Search with Model Selection	Dec 1, 2012	modelModel Selection	—Unverified
Nonparametric Bayesian Inverse Reinforcement Learning for Multiple Reward Functions	Dec 1, 2012	reinforcement-learningReinforcement Learning	—Unverified
Transferring Expectations in Model-based Reinforcement Learning	Dec 1, 2012	modelModel-based Reinforcement Learning	—Unverified
Value Pursuit Iteration	Dec 1, 2012	Reinforcement LearningReinforcement Learning (RL)	—Unverified
On-line Reinforcement Learning Using Incremental Kernel-Based Stochastic Factorization	Dec 1, 2012	reinforcement-learningReinforcement Learning	—Unverified
Neurally Plausible Reinforcement Learning of Working Memory Tasks	Dec 1, 2012	Decision Makingreinforcement-learning	—Unverified
Sketch-Based Linear Value Function Approximation	Dec 1, 2012	Atari Gamesreinforcement-learning	—Unverified
Algorithms for Learning Markov Field Policies	Dec 1, 2012	reinforcement-learningReinforcement Learning	—Unverified
Bayesian Hierarchical Reinforcement Learning	Dec 1, 2012	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Inverse Reinforcement Learning through Structured Classification	Dec 1, 2012	ClassificationGeneral Classification	—Unverified
Exploration in Model-based Reinforcement Learning by Empirically Estimating Learning Progress	Dec 1, 2012	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Cost-Sensitive Exploration in Bayesian Reinforcement Learning	Dec 1, 2012	reinforcement-learningReinforcement Learning	—Unverified
TACT: A Transfer Actor-Critic Learning Framework for Energy Saving in Cellular Radio Access Networks	Nov 28, 2012	reinforcement-learningReinforcement Learning	—Unverified
Autonomous Reinforcement of Behavioral Sequences in Neural Dynamics	Oct 12, 2012	General Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 301 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified