Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14851–14900 of 15113 papers

Title	Date	Tasks	Status
Learning to Compose Neural Networks for Question Answering	Jan 7, 2016	Question Answeringreinforcement-learning	CodeCode Available
Angrier Birds: Bayesian reinforcement learning	Jan 6, 2016	Efficient ExplorationQ-Learning	CodeCode Available
Taming the Noise in Reinforcement Learning via Soft Updates	Dec 28, 2015	Q-Learningreinforcement-learning	CodeCode Available
Inverse Reinforcement Learning via Deep Gaussian Process	Dec 26, 2015	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning in Large Discrete Action Spaces	Dec 24, 2015	Deep Reinforcement LearningRecommendation Systems	CodeCode Available
An Empirical Comparison of Neural Architectures for Reinforcement Learning in Partially Observable Environments	Dec 17, 2015	CPUreinforcement-learning	—Unverified
Increasing the Action Gap: New Operators for Reinforcement Learning	Dec 15, 2015	Atari GamesQ-Learning	CodeCode Available
How to Discount Deep Reinforcement Learning: Towards New Dynamic Strategies	Dec 7, 2015	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Attention Recurrent Q-Network	Dec 5, 2015	Atari GamesDeep Attention	CodeCode Available
Risk-Constrained Reinforcement Learning with Percentile Risk Criteria	Dec 5, 2015	Decision MakingMarketing	—Unverified
Q-Networks for Binary Vector Actions	Dec 4, 2015	Q-Learningreinforcement-learning	—Unverified
State of the Art Control of Atari Games Using Shallow Reinforcement Learning	Dec 4, 2015	Atari Gamesreinforcement-learning	CodeCode Available
Multi-Class Multi-Annotator Active Learning With Robust Gaussian Process for Visual Recognition	Dec 1, 2015	Active LearningBayesian Inference	—Unverified
Inverse Reinforcement Learning with Locally Consistent Reward Functions	Dec 1, 2015	Clusteringreinforcement-learning	—Unverified
On Learning to Think: Algorithmic Information Theory for Novel Combinations of Reinforcement Learning Controllers and Recurrent Neural World Models	Nov 30, 2015	Decision MakingReinforcement Learning	—Unverified
Reinforcement Learning Applied to an Electric Water Heater: From Theory to Practice	Nov 29, 2015	Decision Makingreinforcement-learning	—Unverified
Robotic Search & Rescue via Online Multi-task Reinforcement Learning	Nov 29, 2015	Lifelong learningQ-Learning	—Unverified
On the convergence of cycle detection for navigational reinforcement learning	Nov 27, 2015	Navigatereinforcement-learning	—Unverified
Strategic Dialogue Management via Deep Reinforcement Learning	Nov 25, 2015	Deep Reinforcement LearningDialogue Management	CodeCode Available
MazeBase: A Sandbox for Learning from Games	Nov 23, 2015	NegationReinforcement Learning	CodeCode Available
Dueling Network Architectures for Deep Reinforcement Learning	Nov 20, 2015	Atari GamesDeep Reinforcement Learning	CodeCode Available
Conditional Computation in Neural Networks for faster models	Nov 19, 2015	reinforcement-learningReinforcement Learning	CodeCode Available
Actor-Mimic: Deep Multitask and Transfer Reinforcement Learning	Nov 19, 2015	Atari GamesDeep Reinforcement Learning	CodeCode Available
Policy Distillation	Nov 19, 2015	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Active Object Localization with Deep Reinforcement Learning	Nov 18, 2015	Active Object LocalizationDeep Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning with a Natural Language Action Space	Nov 14, 2015	Deep Reinforcement LearningQ-Learning	CodeCode Available
Towards Vision-Based Deep Reinforcement Learning for Robotic Motion Control	Nov 12, 2015	Deep Reinforcement Learningreinforcement-learning	—Unverified
Doubly Robust Off-policy Value Evaluation for Reinforcement Learning	Nov 11, 2015	Decision Makingreinforcement-learning	—Unverified
Learning Unfair Trading: a Market Manipulation Analysis From the Reinforcement Learning Perspective	Nov 2, 2015	reinforcement-learningReinforcement Learning	—Unverified
Generating Text with Deep Reinforcement Learning	Oct 30, 2015	DecoderDeep Reinforcement Learning	—Unverified
Sample Complexity of Episodic Fixed-Horizon Reinforcement Learning	Oct 29, 2015	reinforcement-learningReinforcement Learning	—Unverified
On the Computability of AIXI	Oct 19, 2015	BIG-bench Machine Learningreinforcement-learning	—Unverified
Dual Control for Approximate Bayesian Reinforcement Learning	Oct 13, 2015	regressionreinforcement-learning	—Unverified
Data-Efficient Learning of Feedback Policies from Image Pixels using Deep Dynamical Models	Oct 8, 2015	Model-based Reinforcement LearningModel Predictive Control	—Unverified
Variational Information Maximisation for Intrinsically Motivated Reinforcement Learning	Sep 29, 2015	BIG-bench Machine Learningreinforcement-learning	CodeCode Available
One-Shot Learning of Manipulation Skills with Online Dynamics Adaptation and Neural Network Priors	Sep 23, 2015	Model-based Reinforcement LearningModel Predictive Control	—Unverified
Model-based Reinforcement Learning with Parametrized Physical Models and Optimism-Driven Exploration	Sep 23, 2015	Model-based Reinforcement LearningModel Predictive Control	—Unverified
Learning Deep Control Policies for Autonomous Aerial Vehicles with MPC-Guided Policy Search	Sep 22, 2015	Model Predictive Controlreinforcement-learning	—Unverified
Deep Spatial Autoencoders for Visuomotor Learning	Sep 21, 2015	reinforcement-learningReinforcement Learning	CodeCode Available
Benchmarking for Bayesian Reinforcement Learning	Sep 14, 2015	Benchmarkingreinforcement-learning	—Unverified
Optimization of anemia treatment in hemodialysis patients via reinforcement learning	Sep 14, 2015	Decision MakingQ-Learning	—Unverified
Recurrent Reinforcement Learning: A Hybrid Approach	Sep 10, 2015	reinforcement-learningReinforcement Learning	—Unverified
Compatible Value Gradients for Reinforcement Learning of Continuous Deep Policies	Sep 10, 2015	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning with Parameterized Actions	Sep 5, 2015	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning in Multi-Party Trading Dialog	Sep 1, 2015	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning of Multi-Issue Negotiation Dialogue Policies	Sep 1, 2015	Dialogue Managementreinforcement-learning	—Unverified
Optimising Turn-Taking Strategies With Reinforcement Learning	Sep 1, 2015	Dialogue Managementreinforcement-learning	—Unverified
Hyper-parameter Optimisation of Gaussian Process Reinforcement Learning for Statistical Dialogue Management	Sep 1, 2015	Dialogue ManagementManagement	—Unverified
A Cognitive Architecture Based on a Learning Classifier System with Spiking Classifiers	Aug 31, 2015	reinforcement-learningReinforcement Learning	—Unverified
Learning Efficient Representations for Reinforcement Learning	Aug 28, 2015	Decision Makingreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 298 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified