Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 15051–15100 of 15113 papers

Title	Date	Tasks	Status	Hype
Reinforcement Learning of Question-Answering Dialogue Policies for Virtual Museum Guides	Jul 1, 2012	Dialogue ManagementQuestion Answering	—Unverified	0
Framework of Automatic Text Summarization Using Reinforcement Learning	Jul 1, 2012	Document SummarizationMulti-Document Summarization	—Unverified	0
Policy Gradients with Variance Related Risk Criteria	Jun 27, 2012	Reinforcement Learning (RL)	—Unverified	0
Monte Carlo Bayesian Reinforcement Learning	Jun 27, 2012	reinforcement-learningReinforcement Learning	—Unverified	0
Apprenticeship Learning using Inverse Reinforcement Learning and Gradient Methods	Jun 20, 2012	reinforcement-learningReinforcement Learning	—Unverified	0
Artist Agent: A Reinforcement Learning Approach to Automatic Stroke Generation in Oriental Ink Painting	Jun 18, 2012	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Off-Policy Actor-Critic	May 22, 2012	reinforcement-learningReinforcement Learning	CodeCode Available	0
Efficient Bayes-Adaptive Reinforcement Learning using Sample-Based Search	May 14, 2012	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Evaluation of Online Dialogue Policy Learning Techniques	May 1, 2012	Dialogue ManagementManagement	—Unverified	0
A Comparative Study of Reinforcement Learning Techniques on Dialogue Management	Apr 1, 2012	Dialogue ManagementManagement	—Unverified	0
PAC-Bayesian Policy Evaluation for Reinforcement Learning	Feb 14, 2012	Model Selectionreinforcement-learning	—Unverified	0
Multi-timescale Nexting in a Reinforcement Learning Robot	Dec 6, 2011	reinforcement-learningReinforcement Learning	—Unverified	0
Selecting the State-Representation in Reinforcement Learning	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified	0
Policy Gradient Coagent Networks	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified	0
MAP Inference for Bayesian Inverse Reinforcement Learning	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified	0
Blending Autonomous Exploration and Apprenticeship Learning	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified	0
A Reinforcement Learning Theory for Homeostatic Regulation	Dec 1, 2011	Learning Theoryreinforcement-learning	—Unverified	0
Action-Gap Phenomenon in Reinforcement Learning	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified	0
Clustering via Dirichlet Process Mixture Models for Portable Skill Discovery	Dec 1, 2011	ClusteringReinforcement Learning	—Unverified	0
Analysis and Improvement of Policy Gradient Estimation	Dec 1, 2011	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Reinforcement Learning using Kernel-Based Stochastic Factorization	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified	0
Optimal Reinforcement Learning for Gaussian Systems	Dec 1, 2011	Gaussian Processesreinforcement-learning	—Unverified	0
Nonlinear Inverse Reinforcement Learning with Gaussian Processes	Dec 1, 2011	Gaussian Processesreinforcement-learning	CodeCode Available	0
Transfer from Multiple MDPs	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified	0
Risk-Sensitive Reinforcement Learning Applied to Control under Constraints	Sep 9, 2011	reinforcement-learningReinforcement Learning	—Unverified	0
A Tutorial on Bayesian Optimization of Expensive Cost Functions, with Application to Active User Modeling and Hierarchical Reinforcement Learning	Dec 12, 2010	Bayesian OptimizationHierarchical Reinforcement Learning	CodeCode Available	2
Interval Estimation for Reinforcement-Learning Algorithms in Continuous-State Domains	Dec 1, 2010	Decision Makingparameter estimation	—Unverified	0
Constructing Skill Trees for Reinforcement Learning Agents from Demonstration Trajectories	Dec 1, 2010	reinforcement-learningReinforcement Learning	—Unverified	0
Feature Construction for Inverse Reinforcement Learning	Dec 1, 2010	reinforcement-learningReinforcement Learning	—Unverified	0
Linear Complementarity for Regularized Policy Evaluation and Improvement	Dec 1, 2010	feature selectionReinforcement Learning	—Unverified	0
Double Q-learning	Dec 1, 2010	Q-Learningreinforcement-learning	—Unverified	0
Nonparametric Bayesian Policy Priors for Reinforcement Learning	Dec 1, 2010	reinforcement-learningReinforcement Learning	—Unverified	0
LSTD with Random Projections	Dec 1, 2010	reinforcement-learningReinforcement Learning	—Unverified	0
Predictive State Temporal Difference Learning	Dec 1, 2010	reinforcement-learningReinforcement Learning	—Unverified	0
PAC-Bayesian Model Selection for Reinforcement Learning	Dec 1, 2010	modelModel Selection	—Unverified	0
Fast Reinforcement Learning for Energy-Efficient Wireless Communications	Sep 29, 2010	Managementreinforcement-learning	—Unverified	0
Reinforcement Learning via AIXI Approximation	Jul 13, 2010	General Reinforcement LearningOpen-Ended Question Answering	—Unverified	0
Computational Model of Music Sight Reading: A Reinforcement Learning Approach	Jul 4, 2010	reinforcement-learningReinforcement Learning	—Unverified	0
Feature Selection as a One-Player Game	May 17, 2010	Automated Feature Engineeringfeature selection	—Unverified	0
A Generalized Natural Actor-Critic Algorithm	Dec 1, 2009	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Training Factor Graphs with Reinforcement Learning for Efficient MAP Inference	Dec 1, 2009	reinforcement-learningReinforcement Learning	—Unverified	0
Manifold Embeddings for Model-Based Reinforcement Learning under Partial Observability	Dec 1, 2009	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Solving Stochastic Games	Dec 1, 2009	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Skill Discovery in Continuous Reinforcement Learning Domains using Skill Chaining	Dec 1, 2009	reinforcement-learningReinforcement Learning	—Unverified	0
Discrete MDL Predicts in Total Variation	Dec 1, 2009	reinforcement-learningReinforcement Learning	—Unverified	0
A Monte Carlo AIXI Approximation	Sep 4, 2009	General Reinforcement LearningOpen-Ended Question Answering	CodeCode Available	0
Hebbian Learning of Bayes Optimal Decisions	Dec 1, 2008	Bayesian InferenceDecision Making	—Unverified	0
Regularized Policy Iteration	Dec 1, 2008	L2 Regularizationreinforcement-learning	—Unverified	0
Policy Search for Motor Primitives in Robotics	Dec 1, 2008	Imitation LearningPolicy Gradient Methods	—Unverified	0
Multi-resolution Exploration in Continuous Spaces	Dec 1, 2008	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 302 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified