Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14751–14800 of 15113 papers

Title	Date	Tasks	Status
Reinforcement Learning algorithms for regret minimization in structured Markov Decision Processes	Aug 17, 2016	reinforcement-learningReinforcement Learning	—Unverified
Open Problem: Approximate Planning of POMDPs in the class of Memoryless Policies	Aug 17, 2016	Decision MakingReinforcement Learning	—Unverified
BBQ-Networks: Efficient Exploration in Deep Reinforcement Learning for Task-Oriented Dialogue Systems	Aug 17, 2016	Deep Reinforcement LearningEfficient Exploration	—Unverified
Perceptual Reward Functions	Aug 12, 2016	reinforcement-learningReinforcement Learning	—Unverified
On Lower Bounds for Regret in Reinforcement Learning	Aug 9, 2016	reinforcement-learningReinforcement Learning	—Unverified
Posterior Sampling for Reinforcement Learning Without Episodes	Aug 9, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
Neuroevolution-Based Inverse Reinforcement Learning	Aug 9, 2016	reinforcement-learningReinforcement Learning	—Unverified
Online Adaptation of Deep Architectures with Reinforcement Learning	Aug 8, 2016	Denoisingreinforcement-learning	—Unverified
Discovering Latent States for Model Learning: Applying Sensorimotor Contingencies Theory and Predictive Processing to Model Context	Aug 1, 2016	modelreinforcement-learning	—Unverified
Self-organization in a distributed coordination game through heuristic rules	Jul 31, 2016	AttributeReinforcement Learning (RL)	—Unverified
A Sensorimotor Reinforcement Learning Framework for Physical Human-Robot Interaction	Jul 27, 2016	Bayesian OptimizationGaussian Processes	—Unverified
Accelerating Stochastic Composition Optimization	Jul 25, 2016	reinforcement-learningReinforcement Learning	—Unverified
An Actor-Critic Algorithm for Sequence Prediction	Jul 24, 2016	Caption GenerationMachine Translation	CodeCode Available
Playing Atari Games with Deep Reinforcement Learning and Human Checkpoint Replay	Jul 18, 2016	Atari GamesDeep Reinforcement Learning	CodeCode Available
Sequential Cost-Sensitive Feature Acquisition	Jul 13, 2016	reinforcement-learningReinforcement Learning	—Unverified
Automatic Bridge Bidding Using Deep Reinforcement Learning	Jul 12, 2016	Decision MakingDeep Reinforcement Learning	—Unverified
A Greedy Approach to Adapting the Trace Parameter for Temporal Difference Learning	Jul 2, 2016	Meta-Learningreinforcement-learning	CodeCode Available
Why is Posterior Sampling Better than Optimism for Reinforcement Learning?	Jul 1, 2016	reinforcement-learningReinforcement Learning	—Unverified
Is the Bellman residual a bad proxy?	Jun 24, 2016	reinforcement-learningReinforcement Learning	—Unverified
Unsupervised preprocessing for Tactile Data	Jun 23, 2016	reinforcement-learningReinforcement Learning	—Unverified
Simultaneous Control and Human Feedback in the Training of a Robotic Agent with Actor-Critic Reinforcement Learning	Jun 22, 2016	reinforcement-learningReinforcement Learning	—Unverified
A Hierarchical Reinforcement Learning Method for Persistent Time-Sensitive Tasks	Jun 20, 2016	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
On Reward Function for Survival	Jun 18, 2016	reinforcement-learningReinforcement Learning	—Unverified
Successor Features for Transfer in Reinforcement Learning	Jun 16, 2016	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning Discovers Internal Models	Jun 16, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning With Macro-Actions	Jun 15, 2016	Atari GamesDeep Reinforcement Learning	—Unverified
Natural Language Generation as Planning under Uncertainty Using Reinforcement Learning	Jun 15, 2016	reinforcement-learningReinforcement Learning	—Unverified
Model-Free Episodic Control	Jun 14, 2016	Decision MakingDeep Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning with a Combinatorial Action Space for Predicting Popular Reddit Threads	Jun 12, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Policy Networks with Two-Stage Training for Dialogue Systems	Jun 10, 2016	Deep Reinforcement LearningDialogue State Tracking	—Unverified
Cooperative Inverse Reinforcement Learning	Jun 9, 2016	Active Learningreinforcement-learning	CodeCode Available
Face valuing: Training user interfaces with facial expressions and reinforcement learning	Jun 9, 2016	BIG-bench Machine Learningreinforcement-learning	—Unverified
Continuously Learning Neural Dialogue Management	Jun 8, 2016	Dialogue ManagementManagement	—Unverified
Deep Successor Reinforcement Learning	Jun 8, 2016	Deep Reinforcement LearningFPS Games	CodeCode Available
Towards End-to-End Learning for Dialog State Tracking and Management using Deep Reinforcement Learning	Jun 8, 2016	Deep Reinforcement Learningdialog state tracking	CodeCode Available
Safe and Efficient Off-Policy Reinforcement Learning	Jun 8, 2016	Atari Gamesreinforcement-learning	CodeCode Available
Adapting Sampling Interval of Sensor Networks Using On-Line Reinforcement Learning	Jun 7, 2016	reinforcement-learningReinforcement Learning	—Unverified
Learning to Optimize	Jun 6, 2016	reinforcement-learningReinforcement Learning	—Unverified
Unifying Count-Based Exploration and Intrinsic Motivation	Jun 6, 2016	Atari GamesMontezuma's Revenge	CodeCode Available
Deep Reinforcement Learning for Dialogue Generation	Jun 5, 2016	ChatbotDeep Reinforcement Learning	CodeCode Available
Deep Q-Networks for Accelerating the Training of Deep Neural Networks	Jun 5, 2016	Deep Reinforcement LearningReinforcement Learning	—Unverified
End-to-end LSTM-based dialog control optimized with supervised and reinforcement learning	Jun 3, 2016	Feature EngineeringReinforcement Learning	—Unverified
Difference of Convex Functions Programming Applied to Control with Expert Data	Jun 3, 2016	General Classificationreinforcement-learning	—Unverified
Reinforcement Learning for Semantic Segmentation in Indoor Scenes	Jun 3, 2016	reinforcement-learningReinforcement Learning	—Unverified
Death and Suicide in Universal Artificial Intelligence	Jun 2, 2016	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Reinforcement Learning for Visual Object Detection	Jun 1, 2016	Objectobject-detection	—Unverified
VIME: Variational Information Maximizing Exploration	May 31, 2016	continuous-controlContinuous Control	CodeCode Available
Information Theoretically Aided Reinforcement Learning for Embodied Agents	May 31, 2016	reinforcement-learningReinforcement Learning	—Unverified
Control of Memory, Active Perception, and Action in Minecraft	May 30, 2016	Deep Reinforcement LearningMinecraft	—Unverified
Deep Reinforcement Learning Radio Control and Signal Detection with KeRLym, a Gym RL Agent	May 30, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 296 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified