Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14901–14950 of 15113 papers

Title	Date	Tasks	Status
Multi-agent Reinforcement Learning with Sparse Interactions by Negotiation and Knowledge Transfer	Aug 21, 2015	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Distributed Deep Q-Learning	Aug 18, 2015	Q-Learningreinforcement-learning	—Unverified
Action-Conditional Video Prediction using Deep Networks in Atari Games	Jul 31, 2015	Atari GamesReinforcement Learning	CodeCode Available
A Reinforcement Learning Approach to Online Learning of Decision Trees	Jul 24, 2015	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for the Unit Commitment Problem	Jul 19, 2015	reinforcement-learningReinforcement Learning	—Unverified
Maximum Entropy Deep Inverse Reinforcement Learning	Jul 17, 2015	reinforcement-learningReinforcement Learning	CodeCode Available
Massively Parallel Methods for Deep Reinforcement Learning	Jul 15, 2015	Atari GamesDeep Reinforcement Learning	CodeCode Available
On the Computability of Solomonoff Induction and Knowledge-Seeking	Jul 15, 2015	reinforcement-learningReinforcement Learning	—Unverified
Experimental analysis of data-driven control for a building heating system	Jul 13, 2015	Decision Makingreinforcement-learning	—Unverified
Incentivizing Exploration In Reinforcement Learning With Deep Predictive Models	Jul 3, 2015	Atari Gamesreinforcement-learning	CodeCode Available
Online Transfer Learning in Reinforcement Learning Domains	Jul 2, 2015	Q-Learningreinforcement-learning	—Unverified
Bootstrapped Thompson Sampling and Deep Exploration	Jul 1, 2015	reinforcement-learningReinforcement Learning	—Unverified
Language Understanding for Text-based Games Using Deep Reinforcement Learning	Jun 30, 2015	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Bootstrapping Skills	Jun 11, 2015	Reinforcement LearningReinforcement Learning (RL)	—Unverified
The Online Coupon-Collector Problem and Its Application to Lifelong Reinforcement Learning	Jun 10, 2015	Lifelong learningreinforcement-learning	—Unverified
Cumulative Prospect Theory Meets Reinforcement Learning: Prediction and Control	Jun 8, 2015	Predictionreinforcement-learning	—Unverified
A Framework for Constrained and Adaptive Behavior-Based Agents	Jun 7, 2015	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Local Nonstationarity for Efficient Bayesian Optimization	Jun 5, 2015	Bayesian OptimizationBIG-bench Machine Learning	—Unverified
Safe Policy Search for Lifelong Reinforcement Learning with Sublinear Regret	May 21, 2015	Lifelong learningreinforcement-learning	—Unverified
A Definition of Happiness for Reinforcement Learning Agents	May 18, 2015	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning applied to Single Neuron	May 15, 2015	reinforcement-learningReinforcement Learning	—Unverified
Learning Where to Sample in Structured Prediction	May 9, 2015	PredictionReinforcement Learning (RL)	CodeCode Available
Context-Aware Mobility Management in HetNets: A Reinforcement Learning Approach	May 7, 2015	FairnessManagement	—Unverified
Optimal Neuron Selection: NK Echo State Networks for Reinforcement Learning	May 7, 2015	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Neural Turing Machines - Revised	May 4, 2015	reinforcement-learningReinforcement Learning	CodeCode Available
Stability of Stochastic Approximations with `Controlled Markov' Noise and Temporal Difference Learning	Apr 23, 2015	reinforcement-learningReinforcement Learning	—Unverified
Residential Demand Response Applications Using Batch Reinforcement Learning	Apr 8, 2015	reinforcement-learningReinforcement Learning	—Unverified
Correct-by-synthesis reinforcement learning with temporal logic constraints	Mar 5, 2015	Motion PlanningQ-Learning	—Unverified
Human level control through deep reinforcement learning	Feb 25, 2015	Atari GamesDeep Reinforcement Learning	CodeCode Available
Reinforcement Learning in a Neurally Controlled Robot Using Dopamine Modulated STDP	Feb 21, 2015	reinforcement-learningReinforcement Learning	—Unverified
Gaussian Processes for Data-Efficient Learning in Robotics and Control	Feb 10, 2015	Gaussian ProcessesReinforcement Learning	CodeCode Available
Efficient model-based reinforcement learning for approximate online optimal	Feb 9, 2015	Model-based Reinforcement Learningreinforcement-learning	—Unverified
From Pixels to Torques: Policy Learning with Deep Dynamical Models	Feb 8, 2015	Model-based Reinforcement LearningModel Predictive Control	—Unverified
Multiple Object Recognition with Visual Attention	Dec 24, 2014	ObjectObject Recognition	CodeCode Available
Regression with Linear Factored Functions	Dec 19, 2014	Gaussian Processesregression	—Unverified
Grounding Hierarchical Reinforcement Learning Models for Knowledge Transfer	Dec 19, 2014	Deep LearningHierarchical Reinforcement Learning	—Unverified
Reinforcement Learning and Nonparametric Detection of Game-Theoretic Equilibrium Play in Social Networks	Dec 11, 2014	reinforcement-learningReinforcement Learning	—Unverified
Sparse Multi-Task Reinforcement Learning	Dec 1, 2014	reinforcement-learningReinforcement Learning	—Unverified
RAAM: The Benefits of Robustness in Approximating Aggregated MDPs in Reinforcement Learning	Dec 1, 2014	reinforcement-learningReinforcement Learning	—Unverified
Deep Learning for Real-Time Atari Game Play Using Offline Monte-Carlo Tree Search Planning	Dec 1, 2014	Atari GamesDeep Learning	—Unverified
Difference of Convex Functions Programming for Reinforcement Learning	Dec 1, 2014	reinforcement-learningReinforcement Learning	—Unverified
Design Principles of the Hippocampal Cognitive Map	Dec 1, 2014	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
How hard is my MDP?" The distribution-norm to the rescue"	Dec 1, 2014	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Multiple Instance Reinforcement Learning for Efficient Weakly-Supervised Detection in Images	Nov 29, 2014	Action Detectionreinforcement-learning	—Unverified
Compress and Control	Nov 19, 2014	Reinforcement LearningReinforcement Learning (RL)	—Unverified
A Comparison of learning algorithms on the Arcade Learning Environment	Oct 31, 2014	Atari Gamesreinforcement-learning	—Unverified
Do Artificial Reinforcement-Learning Agents Matter Morally?	Oct 30, 2014	reinforcement-learningReinforcement Learning	—Unverified
Domain-Independent Optimistic Initialization for Reinforcement Learning	Oct 16, 2014	reinforcement-learningReinforcement Learning	—Unverified
Don't Until the Final Verb Wait: Reinforcement Learning for Simultaneous Machine Translation	Oct 1, 2014	Machine Translationreinforcement-learning	—Unverified
Fear the REAPER: A System for Automatic Multi-Document Summarization with Reinforcement Learning	Oct 1, 2014	Document SummarizationMulti-Document Summarization	—Unverified

Show:10 25 50

← PrevPage 299 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified