Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14601–14650 of 15113 papers

Title	Date	Tasks	Status	Hype
Toward negotiable reinforcement learning: shifting priorities in Pareto optimal sequential decision-making	Jan 5, 2017	Decision MakingMulti-Objective Reinforcement Learning	—Unverified	0
Non-Deterministic Policy Improvement Stabilizes Approximated Reinforcement Learning	Dec 22, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
On the function approximation error for risk-sensitive reinforcement learning	Dec 22, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
First-Person Activity Forecasting with Online Inverse Reinforcement Learning	Dec 22, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Loss is its own Reward: Self-Supervision for Reinforcement Learning	Dec 21, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
A Survey of Deep Network Solutions for Learning Control in Robotics: From Reinforcement to Imitation	Dec 21, 2016	Deep Reinforcement LearningImitation Learning	CodeCode Available	0
Unsupervised Perceptual Rewards for Imitation Learning	Dec 20, 2016	Imitation LearningReinforcement Learning	—Unverified	0
Self-Correcting Models for Model-Based Reinforcement Learning	Dec 19, 2016	modelModel-based Reinforcement Learning	CodeCode Available	0
Sample-efficient Deep Reinforcement Learning for Dialog Control	Dec 18, 2016	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Reinforcement Learning Using Quantum Boltzmann Machines	Dec 17, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Learning to predict where to look in interactive environments using deep recurrent q-learning	Dec 17, 2016	Atari GamesQ-Learning	—Unverified	0
A User Simulator for Task-Completion Dialogues	Dec 17, 2016	reinforcement-learningReinforcement Learning	CodeCode Available	0
An Alternative Softmax Operator for Reinforcement Learning	Dec 16, 2016	Decision Makingreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning with Successor Features for Navigation across Similar Environments	Dec 16, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning through Dialogue Interactions by Asking Questions	Dec 15, 2016	reinforcement-learningReinforcement Learning	CodeCode Available	2
Separation of Concerns in Reinforcement Learning	Dec 15, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Response to Comment on 'Perceptual Learning Incepted by Decoded fMRI Neurofeedback Without Stimulus Presentation'; How can a decoded neurofeedback method (DecNef) lead to successful reinforcement and visual perceptual learning?	Dec 13, 2016	Reinforcement Learning (RL)	—Unverified	0
End-to-End Deep Reinforcement Learning for Lane Keeping Assist	Dec 13, 2016	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Incorporating Human Domain Knowledge into Large Scale Cost Function Learning	Dec 13, 2016	Motion Planningreinforcement-learning	—Unverified	0
Online Reinforcement Learning for Real-Time Exploration in Continuous State and Action Markov Decision Processes	Dec 12, 2016	regressionReinforcement Learning	—Unverified	0
PoseAgent: Budget-Constrained 6D Object Pose Estimation via Reinforcement Learning	Dec 12, 2016	6D Pose Estimation using RGBPose Estimation	—Unverified	0
Learning to Drive using Inverse Reinforcement Learning and Deep Q-Networks	Dec 12, 2016	Autonomous Drivingreinforcement-learning	—Unverified	0
Reinforcement Learning With Temporal Logic Rewards	Dec 11, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Towards deep learning with spiking neurons in energy based models with contrastive Hebbian plasticity	Dec 9, 2016	Deep LearningGeneral Classification	—Unverified	0
Towards Information-Seeking Agents	Dec 8, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Stochastic Primal-Dual Methods and Sample Complexity of Reinforcement Learning	Dec 8, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Hierarchy through Composition with Linearly Solvable Markov Decision Processes	Dec 8, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Cryptocurrency Portfolio Management with Deep Reinforcement Learning	Dec 5, 2016	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Learning to superoptimize programs - Workshop Version	Dec 4, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Learning of Robotic Tasks without a Simulator using Strong and Weak Human Supervision	Dec 4, 2016	Imitation Learningreinforcement-learning	—Unverified	0
Self-critical Sequence Training for Image Captioning	Dec 2, 2016	Image CaptioningPolicy Gradient Methods	CodeCode Available	1
Showing versus doing: Teaching by demonstration	Dec 1, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Adaptive optimal training of animal behavior	Dec 1, 2016	Experimental Designreinforcement-learning	—Unverified	0
Linear Feature Encoding for Reinforcement Learning	Dec 1, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Bayesian Optimization with Robust Bayesian Neural Networks	Dec 1, 2016	Bayesian OptimizationDeep Reinforcement Learning	CodeCode Available	0
Bootstrapping incremental dialogue systems: using linguistic knowledge to learn from minimal data	Dec 1, 2016	Dialogue ManagementManagement	—Unverified	0
Playing Doom with SLAM-Augmented Deep Reinforcement Learning	Dec 1, 2016	Deep Reinforcement Learningobject-detection	CodeCode Available	0
Generalizing Skills with Semi-Supervised Reinforcement Learning	Dec 1, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Exploration for Multi-task Reinforcement Learning with Deep Generative Models	Nov 29, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Dialogue Learning With Human-In-The-Loop	Nov 29, 2016	Question Answeringreinforcement-learning	CodeCode Available	2
Neural Combinatorial Optimization with Reinforcement Learning	Nov 29, 2016	Combinatorial Optimizationreinforcement-learning	CodeCode Available	1
Nonparametric General Reinforcement Learning	Nov 28, 2016	General Reinforcement Learningreinforcement-learning	—Unverified	0
Learning to Compose Words into Sentences with Reinforcement Learning	Nov 28, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Improving Policy Gradient by Exploring Under-appreciated Rewards	Nov 28, 2016	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Deep Reinforcement Learning for Multi-Domain Dialogue Systems	Nov 26, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Training an Interactive Humanoid Robot Using Multimodal Deep Reinforcement Learning	Nov 26, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
A Simple, Fast Diverse Decoding Algorithm for Neural Generation	Nov 25, 2016	Abstractive Text SummarizationDiversity	CodeCode Available	0
Multiscale Inverse Reinforcement Learning using Diffusion Wavelets	Nov 24, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Recurrent Attention Models for Depth-Based Person Identification	Nov 22, 2016	Person Identificationreinforcement-learning	—Unverified	0
Variational Intrinsic Control	Nov 22, 2016	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0

Show:10 25 50

← PrevPage 293 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified