Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14751–14800 of 15113 papers

Title	Date	Tasks	Status	Hype
A Hierarchical Reinforcement Learning Method for Persistent Time-Sensitive Tasks	Jun 20, 2016	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
On Reward Function for Survival	Jun 18, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning Discovers Internal Models	Jun 16, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Successor Features for Transfer in Reinforcement Learning	Jun 16, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Natural Language Generation as Planning under Uncertainty Using Reinforcement Learning	Jun 15, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning With Macro-Actions	Jun 15, 2016	Atari GamesDeep Reinforcement Learning	—Unverified	0
Progressive Neural Networks	Jun 15, 2016	Continual Learningreinforcement-learning	CodeCode Available	1
Model-Free Episodic Control	Jun 14, 2016	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Deep Reinforcement Learning with a Combinatorial Action Space for Predicting Popular Reddit Threads	Jun 12, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Generative Adversarial Imitation Learning	Jun 10, 2016	Imitation Learningreinforcement-learning	CodeCode Available	1
Policy Networks with Two-Stage Training for Dialogue Systems	Jun 10, 2016	Deep Reinforcement LearningDialogue State Tracking	—Unverified	0
Face valuing: Training user interfaces with facial expressions and reinforcement learning	Jun 9, 2016	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Cooperative Inverse Reinforcement Learning	Jun 9, 2016	Active Learningreinforcement-learning	CodeCode Available	0
Deep Successor Reinforcement Learning	Jun 8, 2016	Deep Reinforcement LearningFPS Games	CodeCode Available	0
Continuously Learning Neural Dialogue Management	Jun 8, 2016	Dialogue ManagementManagement	—Unverified	0
Towards End-to-End Learning for Dialog State Tracking and Management using Deep Reinforcement Learning	Jun 8, 2016	Deep Reinforcement Learningdialog state tracking	CodeCode Available	0
Safe and Efficient Off-Policy Reinforcement Learning	Jun 8, 2016	Atari Gamesreinforcement-learning	CodeCode Available	0
Adapting Sampling Interval of Sensor Networks Using On-Line Reinforcement Learning	Jun 7, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Learning to Optimize	Jun 6, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Unifying Count-Based Exploration and Intrinsic Motivation	Jun 6, 2016	Atari GamesMontezuma's Revenge	CodeCode Available	0
OpenAI Gym	Jun 5, 2016	reinforcement-learningReinforcement Learning	CodeCode Available	1
Deep Reinforcement Learning for Dialogue Generation	Jun 5, 2016	ChatbotDeep Reinforcement Learning	CodeCode Available	0
Deep Q-Networks for Accelerating the Training of Deep Neural Networks	Jun 5, 2016	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
End-to-end LSTM-based dialog control optimized with supervised and reinforcement learning	Jun 3, 2016	Feature EngineeringReinforcement Learning	—Unverified	0
Reinforcement Learning for Semantic Segmentation in Indoor Scenes	Jun 3, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Difference of Convex Functions Programming Applied to Control with Expert Data	Jun 3, 2016	General Classificationreinforcement-learning	—Unverified	0
Death and Suicide in Universal Artificial Intelligence	Jun 2, 2016	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning for Visual Object Detection	Jun 1, 2016	Objectobject-detection	—Unverified	0
Information Theoretically Aided Reinforcement Learning for Embodied Agents	May 31, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
VIME: Variational Information Maximizing Exploration	May 31, 2016	continuous-controlContinuous Control	CodeCode Available	0
Control of Memory, Active Perception, and Action in Minecraft	May 30, 2016	Deep Reinforcement LearningMinecraft	—Unverified	0
Deep Reinforcement Learning Radio Control and Signal Detection with KeRLym, a Gym RL Agent	May 30, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Model-Free Imitation Learning with Policy Optimization	May 26, 2016	Imitation Learningmodel	—Unverified	0
A PAC RL Algorithm for Episodic POMDPs	May 25, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Learning and Policy Search in Stochastic Dynamical Systems with Bayesian Neural Networks	May 23, 2016	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	0
Learning to Communicate with Deep Multi-Agent Reinforcement Learning	May 21, 2016	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	0
Localizing by Describing: Attribute-Guided Attention Localization for Fine-Grained Recognition	May 20, 2016	Attributereinforcement-learning	—Unverified	0
Option Discovery in Hierarchical Reinforcement Learning using Spatio-Temporal Clustering	May 17, 2016	ClusteringHierarchical Reinforcement Learning	—Unverified	0
A Reinforcement Learning System to Encourage Physical Activity in Diabetes Patients	May 13, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Optimizing human-interpretable dialog management policy using Genetic Algorithm	May 12, 2016	Managementreinforcement-learning	—Unverified	0
Avoiding Wireheading with Value Reinforcement Learning	May 10, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
ViZDoom: A Doom-based AI Research Platform for Visual Reinforcement Learning	May 6, 2016	Atari GamesFPS Games	CodeCode Available	0
Classifying Options for Deep Reinforcement Learning	Apr 27, 2016	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified	0
Tournament selection in zeroth-level classifier systems based on average reward reinforcement learning	Apr 26, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Using Reinforcement Learning to Validate Empirical Game-Theoretic Analysis: A Continuous Double Auction Study	Apr 22, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Benchmarking Deep Reinforcement Learning for Continuous Control	Apr 22, 2016	Action Triplet RecognitionAtari Games	CodeCode Available	2
Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motivation	Apr 20, 2016	Deep Reinforcement LearningMontezuma's Revenge	CodeCode Available	0
Inverse Reinforcement Learning with Simultaneous Estimation of Rewards and Dynamics	Apr 13, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Theoretically-Grounded Policy Advice from Multiple Teachers in Reinforcement Learning Settings with Applications to Negative Transfer	Apr 13, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
A statistical learning strategy for closed-loop control of fluid flows	Apr 11, 2016	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 296 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified