Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14451–14500 of 15113 papers

Title	Date	Tasks	Status	Hype
Deep Episodic Value Iteration for Model-based Meta-Reinforcement Learning	May 9, 2017	Meta Reinforcement LearningModel-based Reinforcement Learning	—Unverified	0
Reinforced Mnemonic Reader for Machine Reading Comprehension	May 8, 2017	Machine Reading ComprehensionQuestion Answering	CodeCode Available	0
Experimental results : Reinforcement Learning of POMDPs using Spectral Methods	May 7, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Machine Comprehension by Text-to-Text Neural Question Generation	May 4, 2017	Question AnsweringQuestion Generation	CodeCode Available	0
Answer Set Programming for Non-Stationary Markov Decision Processes	May 3, 2017	Decision Makingreinforcement-learning	—Unverified	0
Navigating Occluded Intersections with Autonomous Vehicles using Deep Reinforcement Learning	May 2, 2017	Autonomous VehiclesDeep Reinforcement Learning	—Unverified	0
Learning Multimodal Transition Dynamics for Model-Based Reinforcement Learning	May 1, 2017	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	0
Traffic Light Control Using Deep Policy-Gradient and Value-Function Based Reinforcement Learning	Apr 28, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Mapping Instructions and Visual Observations to Actions with Reinforcement Learning	Apr 28, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
On Improving Deep Reinforcement Learning for POMDPs	Apr 26, 2017	Atari GamesDecision Making	CodeCode Available	0
From Language to Programs: Bridging Reinforcement Learning and Maximum Marginal Likelihood	Apr 25, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Molecular De Novo Design through Deep Reinforcement Learning	Apr 25, 2017	Activity PredictionDeep Reinforcement Learning	CodeCode Available	0
Reinforcement Learning-based Thermal Comfort Control for Vehicle Cabins	Apr 25, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Stochastic Constraint Programming as Reinforcement Learning	Apr 24, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Time-Contrastive Networks: Self-Supervised Learning from Video	Apr 23, 2017	Metric Learningreinforcement-learning	CodeCode Available	1
Equivalence Between Policy Gradients and Soft Q-Learning	Apr 21, 2017	Policy Gradient MethodsQ-Learning	—Unverified	0
Modular Multi-Objective Deep Reinforcement Learning with Decision Values	Apr 21, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Reinforcement Learning with External Knowledge and Two-Stage Q-functions for Predicting Popular Reddit Threads	Apr 20, 2017	Q-Learningreinforcement-learning	—Unverified	0
A Reinforcement Learning Approach to Weaning of Mechanical Ventilation in Intensive Care Units	Apr 20, 2017	Managementreinforcement-learning	—Unverified	0
Investigating Recurrence and Eligibility Traces in Deep Q-Networks	Apr 18, 2017	Atari Gamesreinforcement-learning	—Unverified	0
Beating Atari with Natural Language Guided Reinforcement Learning	Apr 18, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Pseudorehearsal in actor-critic agents	Apr 17, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Effective Warm Start for the Online Actor-Critic Reinforcement Learning based mHealth Intervention	Apr 17, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Task-Oriented Query Reformulation with Reinforcement Learning	Apr 15, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
MUSE: Modularizing Unsupervised Sense Embeddings	Apr 15, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
The Reactor: A fast and sample-efficient Actor-Critic agent for Reinforcement Learning	Apr 15, 2017	Atari GamesDistributional Reinforcement Learning	—Unverified	0
Ultrafast photonic reinforcement learning based on laser chaos	Apr 14, 2017	Decision Makingreinforcement-learning	—Unverified	0
Environment-Independent Task Specifications via GLTL	Apr 14, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Optimizing Differentiable Relaxations of Coreference Evaluation Metrics	Apr 14, 2017	Imitation Learningreinforcement-learning	CodeCode Available	0
Virtual to Real Reinforcement Learning for Autonomous Driving	Apr 13, 2017	Autonomous DrivingDomain Adaptation	CodeCode Available	0
Deep Reinforcement Learning-based Image Captioning with Embedding Reward	Apr 12, 2017	Decision MakingDecoder	—Unverified	0
Deep Q-learning from Demonstrations	Apr 12, 2017	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Data-efficient Deep Reinforcement Learning for Dexterous Manipulation	Apr 10, 2017	continuous-controlContinuous Control	—Unverified	0
Stochastic Neural Networks for Hierarchical Reinforcement Learning	Apr 10, 2017	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	0
Dynamic Safe Interruptibility for Decentralized Multi-Agent Reinforcement Learning	Apr 10, 2017	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Composite Task-Completion Dialogue Policy Learning via Hierarchical Deep Reinforcement Learning	Apr 10, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning framework for Autonomous Driving	Apr 8, 2017	Atari GamesAutonomous Driving	CodeCode Available	0
Stein Variational Policy Gradient	Apr 7, 2017	Bayesian Inferencecontinuous-control	—Unverified	0
Finite Sample Analyses for TD(0) with Function Approximation	Apr 4, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
On the Properties of the Softmax Function with Application in Game Theory and Reinforcement Learning	Apr 3, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Multi-Advisor Reinforcement Learning	Apr 3, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Evaluating Persuasion Strategies and Deep Reinforcement Learning methods for Negotiation Dialogue agents	Apr 1, 2017	Deep Reinforcement LearningPersuasion Strategies	—Unverified	0
Integrated Learning of Dialog Strategies and Semantic Parsing	Apr 1, 2017	BIG-bench Machine LearningManagement	—Unverified	0
Learning Visual Servoing with Deep Features and Fitted Q-Iteration	Mar 31, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Sentence Simplification with Deep Reinforcement Learning	Mar 31, 2017	DecoderDeep Reinforcement Learning	CodeCode Available	0
Enter the Matrix: Safely Interruptible Autonomous Systems via Virtualization	Mar 30, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Dynamic Computational Time for Visual Attention	Mar 30, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Inverse Risk-Sensitive Reinforcement Learning	Mar 29, 2017	Decision Makingreinforcement-learning	—Unverified	0
Inverse Reinforcement Learning from Summary Data	Mar 28, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Socially Aware Motion Planning with Deep Reinforcement Learning	Mar 26, 2017	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available	0

Show:10 25 50

← PrevPage 290 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified