Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14501–14550 of 15113 papers

Title	Date	Tasks	Status
Stochastic Constraint Programming as Reinforcement Learning	Apr 24, 2017	reinforcement-learningReinforcement Learning	—Unverified
Modular Multi-Objective Deep Reinforcement Learning with Decision Values	Apr 21, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Equivalence Between Policy Gradients and Soft Q-Learning	Apr 21, 2017	Policy Gradient MethodsQ-Learning	—Unverified
A Reinforcement Learning Approach to Weaning of Mechanical Ventilation in Intensive Care Units	Apr 20, 2017	Managementreinforcement-learning	—Unverified
Reinforcement Learning with External Knowledge and Two-Stage Q-functions for Predicting Popular Reddit Threads	Apr 20, 2017	Q-Learningreinforcement-learning	—Unverified
Investigating Recurrence and Eligibility Traces in Deep Q-Networks	Apr 18, 2017	Atari Gamesreinforcement-learning	—Unverified
Beating Atari with Natural Language Guided Reinforcement Learning	Apr 18, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available
Effective Warm Start for the Online Actor-Critic Reinforcement Learning based mHealth Intervention	Apr 17, 2017	reinforcement-learningReinforcement Learning	—Unverified
Pseudorehearsal in actor-critic agents	Apr 17, 2017	reinforcement-learningReinforcement Learning	—Unverified
Task-Oriented Query Reformulation with Reinforcement Learning	Apr 15, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
The Reactor: A fast and sample-efficient Actor-Critic agent for Reinforcement Learning	Apr 15, 2017	Atari GamesDistributional Reinforcement Learning	—Unverified
MUSE: Modularizing Unsupervised Sense Embeddings	Apr 15, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Ultrafast photonic reinforcement learning based on laser chaos	Apr 14, 2017	Decision Makingreinforcement-learning	—Unverified
Optimizing Differentiable Relaxations of Coreference Evaluation Metrics	Apr 14, 2017	Imitation Learningreinforcement-learning	CodeCode Available
Environment-Independent Task Specifications via GLTL	Apr 14, 2017	reinforcement-learningReinforcement Learning	—Unverified
Virtual to Real Reinforcement Learning for Autonomous Driving	Apr 13, 2017	Autonomous DrivingDomain Adaptation	CodeCode Available
Deep Reinforcement Learning-based Image Captioning with Embedding Reward	Apr 12, 2017	Decision MakingDecoder	—Unverified
Deep Q-learning from Demonstrations	Apr 12, 2017	Decision MakingDeep Reinforcement Learning	CodeCode Available
Dynamic Safe Interruptibility for Decentralized Multi-Agent Reinforcement Learning	Apr 10, 2017	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Composite Task-Completion Dialogue Policy Learning via Hierarchical Deep Reinforcement Learning	Apr 10, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Data-efficient Deep Reinforcement Learning for Dexterous Manipulation	Apr 10, 2017	continuous-controlContinuous Control	—Unverified
Stochastic Neural Networks for Hierarchical Reinforcement Learning	Apr 10, 2017	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning framework for Autonomous Driving	Apr 8, 2017	Atari GamesAutonomous Driving	CodeCode Available
Stein Variational Policy Gradient	Apr 7, 2017	Bayesian Inferencecontinuous-control	—Unverified
Finite Sample Analyses for TD(0) with Function Approximation	Apr 4, 2017	reinforcement-learningReinforcement Learning	—Unverified
Multi-Advisor Reinforcement Learning	Apr 3, 2017	reinforcement-learningReinforcement Learning	—Unverified
On the Properties of the Softmax Function with Application in Game Theory and Reinforcement Learning	Apr 3, 2017	reinforcement-learningReinforcement Learning	—Unverified
Evaluating Persuasion Strategies and Deep Reinforcement Learning methods for Negotiation Dialogue agents	Apr 1, 2017	Deep Reinforcement LearningPersuasion Strategies	—Unverified
Integrated Learning of Dialog Strategies and Semantic Parsing	Apr 1, 2017	BIG-bench Machine LearningManagement	—Unverified
Learning Visual Servoing with Deep Features and Fitted Q-Iteration	Mar 31, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Sentence Simplification with Deep Reinforcement Learning	Mar 31, 2017	DecoderDeep Reinforcement Learning	CodeCode Available
Enter the Matrix: Safely Interruptible Autonomous Systems via Virtualization	Mar 30, 2017	reinforcement-learningReinforcement Learning	—Unverified
Dynamic Computational Time for Visual Attention	Mar 30, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Inverse Risk-Sensitive Reinforcement Learning	Mar 29, 2017	Decision Makingreinforcement-learning	—Unverified
Inverse Reinforcement Learning from Summary Data	Mar 28, 2017	reinforcement-learningReinforcement Learning	—Unverified
Socially Aware Motion Planning with Deep Reinforcement Learning	Mar 26, 2017	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available
Exploration--Exploitation in MDPs with Options	Mar 25, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Cohesion-based Online Actor-Critic Reinforcement Learning for mHealth Intervention	Mar 25, 2017	Decision Makingreinforcement-learning	—Unverified
Unsupervised Basis Function Adaptation for Reinforcement Learning	Mar 23, 2017	reinforcement-learningReinforcement Learning	—Unverified
Unifying PAC and Regret: Uniform PAC Bounds for Episodic Reinforcement Learning	Mar 22, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Fake News Mitigation via Point Process Based Intervention	Mar 22, 2017	reinforcement-learningReinforcement Learning	—Unverified
Deep Exploration via Randomized Value Functions	Mar 22, 2017	Efficient Explorationreinforcement-learning	—Unverified
Faster Reinforcement Learning Using Active Simulators	Mar 22, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Investigation of Language Understanding Impact for Reinforcement Learning Based Dialogue Systems	Mar 21, 2017	reinforcement-learningReinforcement Learning	—Unverified
Black-Box Data-efficient Policy Search for Robotics	Mar 21, 2017	Continuous ControlReinforcement Learning	CodeCode Available
Pseudorehearsal in value function approximation	Mar 21, 2017	Q-Learningreinforcement-learning	—Unverified
Multi-Timescale, Gradient Descent, Temporal Difference Learning with Linear Options	Mar 19, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Online Learning for Offloading and Autoscaling in Energy Harvesting Mobile Edge Computing	Mar 17, 2017	Edge-computingManagement	—Unverified
Deep Decentralized Multi-task Multi-Agent Reinforcement Learning under Partial Observability	Mar 17, 2017	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Minimax Regret Bounds for Reinforcement Learning	Mar 16, 2017	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 291 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified