Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14451–14500 of 15113 papers

Title	Date	Tasks	Status
End-to-end Active Object Tracking via Reinforcement Learning	May 30, 2017	Deep Reinforcement LearningObject	—Unverified
Experience Replay Using Transition Sequences	May 30, 2017	reinforcement-learningReinforcement Learning	—Unverified
Constrained Policy Optimization	May 30, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Fine-grained acceleration control for autonomous intersection management using deep reinforcement learning	May 30, 2017	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Latent Intention Dialogue Models	May 29, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Free energy-based reinforcement learning using a quantum processor	May 29, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Boltzmann Exploration Done Right	May 29, 2017	Decision MakingDecision Making Under Uncertainty	—Unverified
Role Playing Learning for Socially Concomitant Mobile Robot Navigation	May 29, 2017	NavigateReinforcement Learning	—Unverified
First-spike based visual categorization using reward-modulated STDP	May 25, 2017	Game of GoObject Recognition	—Unverified
Cross-Domain Perceptual Reward Functions	May 25, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
State Space Decomposition and Subgoal Creation for Transfer in Deep Reinforcement Learning	May 24, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning with a Corrupted Reward Channel	May 23, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Visual Semantic Planning using Deep Successor Representations	May 23, 2017	Imitation LearningReinforcement Learning	—Unverified
Safe Model-based Reinforcement Learning with Stability Guarantees	May 23, 2017	modelModel-based Reinforcement Learning	CodeCode Available
Continuous State-Space Models for Optimal Sepsis Treatment - a Deep Reinforcement Learning Approach	May 23, 2017	Decision MakingDeep Reinforcement Learning	—Unverified
Enhanced Experience Replay Generation for Efficient Reinforcement Learning	May 23, 2017	Deep Reinforcement LearningGenerative Adversarial Network	—Unverified
Guide Actor-Critic for Continuous Control	May 22, 2017	continuous-controlContinuous Control	CodeCode Available
AIXIjs: A Software Demo for General Reinforcement Learning	May 22, 2017	General Reinforcement LearningOpenAI Gym	CodeCode Available
A unified view of entropy-regularized Markov decision processes	May 22, 2017	Policy Gradient Methodsreinforcement-learning	—Unverified
Ask the Right Questions: Active Question Reformulation with Reinforcement Learning	May 22, 2017	Information RetrievalQuestion Answering	CodeCode Available
Concrete Dropout	May 22, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Learning to Mix n-Step Returns: Generalizing lambda-Returns for Deep Reinforcement Learning	May 21, 2017	BenchmarkingDecision Making	—Unverified
Experience enrichment based task independent reward model	May 21, 2017	modelreinforcement-learning	—Unverified
Shallow Updates for Deep Reinforcement Learning	May 21, 2017	Atari GamesDeep Reinforcement Learning	—Unverified
Learning to Factor Policies and Action-Value Functions: Factored Action Space Representations for Deep Reinforcement learning	May 20, 2017	Decision MakingDeep Reinforcement Learning	—Unverified
Batch Reinforcement Learning on the Industrial Benchmark: First Experiences	May 20, 2017	reinforcement-learningReinforcement Learning	—Unverified
A Comparison of Reinforcement Learning Techniques for Fuzzy Cloud Auto-Scaling	May 19, 2017	ManagementQ-Learning	—Unverified
Atari games and Intel processors	May 19, 2017	Atari GamesBIG-bench Machine Learning	—Unverified
Posterior sampling for reinforcement learning: worst-case regret bounds	May 19, 2017	reinforcement-learningReinforcement Learning	—Unverified
Delving into adversarial attacks on deep policies	May 18, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Feature Control as Intrinsic Motivation for Hierarchical Reinforcement Learning	May 18, 2017	Hierarchical Reinforcement LearningMontezuma's Revenge	CodeCode Available
Automatic Goal Generation for Reinforcement Learning Agents	May 17, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
New Reinforcement Learning Using a Chaotic Neural Network for Emergence of "Thinking" - "Exploration" Grows into "Thinking" through Learning -	May 16, 2017	reinforcement-learningReinforcement Learning	—Unverified
Repeated Inverse Reinforcement Learning	May 15, 2017	Imitation Learningreinforcement-learning	—Unverified
Emotion in Reinforcement Learning Agents and Robots: A Survey	May 15, 2017	AI AgentDecision Making	—Unverified
Efficient Parallel Methods for Deep Reinforcement Learning	May 13, 2017	Deep Reinforcement LearningGPU	CodeCode Available
Deep Episodic Value Iteration for Model-based Meta-Reinforcement Learning	May 9, 2017	Meta Reinforcement LearningModel-based Reinforcement Learning	—Unverified
Policy Iterations for Reinforcement Learning Problems in Continuous Time and Space -- Fundamental Theory and Methods	May 9, 2017	Decision MakingQ-Learning	CodeCode Available
Reinforced Mnemonic Reader for Machine Reading Comprehension	May 8, 2017	Machine Reading ComprehensionQuestion Answering	CodeCode Available
Experimental results : Reinforcement Learning of POMDPs using Spectral Methods	May 7, 2017	reinforcement-learningReinforcement Learning	—Unverified
Machine Comprehension by Text-to-Text Neural Question Generation	May 4, 2017	Question AnsweringQuestion Generation	CodeCode Available
Answer Set Programming for Non-Stationary Markov Decision Processes	May 3, 2017	Decision Makingreinforcement-learning	—Unverified
Navigating Occluded Intersections with Autonomous Vehicles using Deep Reinforcement Learning	May 2, 2017	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Learning Multimodal Transition Dynamics for Model-Based Reinforcement Learning	May 1, 2017	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Traffic Light Control Using Deep Policy-Gradient and Value-Function Based Reinforcement Learning	Apr 28, 2017	reinforcement-learningReinforcement Learning	—Unverified
Mapping Instructions and Visual Observations to Actions with Reinforcement Learning	Apr 28, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
On Improving Deep Reinforcement Learning for POMDPs	Apr 26, 2017	Atari GamesDecision Making	CodeCode Available
Reinforcement Learning-based Thermal Comfort Control for Vehicle Cabins	Apr 25, 2017	reinforcement-learningReinforcement Learning	—Unverified
Molecular De Novo Design through Deep Reinforcement Learning	Apr 25, 2017	Activity PredictionDeep Reinforcement Learning	CodeCode Available
From Language to Programs: Bridging Reinforcement Learning and Maximum Marginal Likelihood	Apr 25, 2017	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 290 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified