Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 15051–15100 of 15113 papers

Title	Date	Tasks	Status
APRIL: Active Preference-learning based Reinforcement Learning	Aug 5, 2012	reinforcement-learningReinforcement Learning	—Unverified
The Arcade Learning Environment: An Evaluation Platform for General Agents	Jul 19, 2012	Atari GamesBenchmarking	CodeCode Available
Reinforcement Learning of Question-Answering Dialogue Policies for Virtual Museum Guides	Jul 1, 2012	Dialogue ManagementQuestion Answering	—Unverified
Framework of Automatic Text Summarization Using Reinforcement Learning	Jul 1, 2012	Document SummarizationMulti-Document Summarization	—Unverified
Monte Carlo Bayesian Reinforcement Learning	Jun 27, 2012	reinforcement-learningReinforcement Learning	—Unverified
Policy Gradients with Variance Related Risk Criteria	Jun 27, 2012	Reinforcement Learning (RL)	—Unverified
Apprenticeship Learning using Inverse Reinforcement Learning and Gradient Methods	Jun 20, 2012	reinforcement-learningReinforcement Learning	—Unverified
Off-Policy Actor-Critic	May 22, 2012	reinforcement-learningReinforcement Learning	CodeCode Available
Efficient Bayes-Adaptive Reinforcement Learning using Sample-Based Search	May 14, 2012	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Evaluation of Online Dialogue Policy Learning Techniques	May 1, 2012	Dialogue ManagementManagement	—Unverified
A Comparative Study of Reinforcement Learning Techniques on Dialogue Management	Apr 1, 2012	Dialogue ManagementManagement	—Unverified
PAC-Bayesian Policy Evaluation for Reinforcement Learning	Feb 14, 2012	Model Selectionreinforcement-learning	—Unverified
Multi-timescale Nexting in a Reinforcement Learning Robot	Dec 6, 2011	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning using Kernel-Based Stochastic Factorization	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified
Transfer from Multiple MDPs	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified
MAP Inference for Bayesian Inverse Reinforcement Learning	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified
Selecting the State-Representation in Reinforcement Learning	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified
Optimal Reinforcement Learning for Gaussian Systems	Dec 1, 2011	Gaussian Processesreinforcement-learning	—Unverified
Policy Gradient Coagent Networks	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified
Nonlinear Inverse Reinforcement Learning with Gaussian Processes	Dec 1, 2011	Gaussian Processesreinforcement-learning	CodeCode Available
Action-Gap Phenomenon in Reinforcement Learning	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified
Blending Autonomous Exploration and Apprenticeship Learning	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified
A Reinforcement Learning Theory for Homeostatic Regulation	Dec 1, 2011	Learning Theoryreinforcement-learning	—Unverified
Clustering via Dirichlet Process Mixture Models for Portable Skill Discovery	Dec 1, 2011	ClusteringReinforcement Learning	—Unverified
Analysis and Improvement of Policy Gradient Estimation	Dec 1, 2011	Policy Gradient Methodsreinforcement-learning	—Unverified
Risk-Sensitive Reinforcement Learning Applied to Control under Constraints	Sep 9, 2011	reinforcement-learningReinforcement Learning	—Unverified
PAC-Bayesian Model Selection for Reinforcement Learning	Dec 1, 2010	modelModel Selection	—Unverified
Predictive State Temporal Difference Learning	Dec 1, 2010	reinforcement-learningReinforcement Learning	—Unverified
LSTD with Random Projections	Dec 1, 2010	reinforcement-learningReinforcement Learning	—Unverified
Nonparametric Bayesian Policy Priors for Reinforcement Learning	Dec 1, 2010	reinforcement-learningReinforcement Learning	—Unverified
Constructing Skill Trees for Reinforcement Learning Agents from Demonstration Trajectories	Dec 1, 2010	reinforcement-learningReinforcement Learning	—Unverified
Interval Estimation for Reinforcement-Learning Algorithms in Continuous-State Domains	Dec 1, 2010	Decision Makingparameter estimation	—Unverified
Feature Construction for Inverse Reinforcement Learning	Dec 1, 2010	reinforcement-learningReinforcement Learning	—Unverified
Double Q-learning	Dec 1, 2010	Q-Learningreinforcement-learning	—Unverified
Linear Complementarity for Regularized Policy Evaluation and Improvement	Dec 1, 2010	feature selectionReinforcement Learning	—Unverified
Fast Reinforcement Learning for Energy-Efficient Wireless Communications	Sep 29, 2010	Managementreinforcement-learning	—Unverified
Reinforcement Learning via AIXI Approximation	Jul 13, 2010	General Reinforcement LearningOpen-Ended Question Answering	—Unverified
Computational Model of Music Sight Reading: A Reinforcement Learning Approach	Jul 4, 2010	reinforcement-learningReinforcement Learning	—Unverified
Feature Selection as a One-Player Game	May 17, 2010	Automated Feature Engineeringfeature selection	—Unverified
A Generalized Natural Actor-Critic Algorithm	Dec 1, 2009	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Discrete MDL Predicts in Total Variation	Dec 1, 2009	reinforcement-learningReinforcement Learning	—Unverified
Solving Stochastic Games	Dec 1, 2009	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Manifold Embeddings for Model-Based Reinforcement Learning under Partial Observability	Dec 1, 2009	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Training Factor Graphs with Reinforcement Learning for Efficient MAP Inference	Dec 1, 2009	reinforcement-learningReinforcement Learning	—Unverified
Skill Discovery in Continuous Reinforcement Learning Domains using Skill Chaining	Dec 1, 2009	reinforcement-learningReinforcement Learning	—Unverified
A Monte Carlo AIXI Approximation	Sep 4, 2009	General Reinforcement LearningOpen-Ended Question Answering	CodeCode Available
Hebbian Learning of Bayes Optimal Decisions	Dec 1, 2008	Bayesian InferenceDecision Making	—Unverified
Near-optimal Regret Bounds for Reinforcement Learning	Dec 1, 2008	reinforcement-learningReinforcement Learning	—Unverified
Optimization on a Budget: A Reinforcement Learning Approach	Dec 1, 2008	Object Trackingreinforcement-learning	—Unverified
Policy Search for Motor Primitives in Robotics	Dec 1, 2008	Imitation LearningPolicy Gradient Methods	—Unverified

Show:10 25 50

← PrevPage 302 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified