Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14401–14450 of 15113 papers

Title	Date	Tasks	Status	Hype
A method for the online construction of the set of states of a Markov Decision Process using Answer Set Programming	Jun 5, 2017	Decision MakingReinforcement Learning	—Unverified	0
UCB Exploration via Q-Ensembles	Jun 5, 2017	Deep Reinforcement LearningQ-Learning	—Unverified	0
Towards Synthesizing Complex Programs from Input-Output Examples	Jun 5, 2017	Program Synthesisreinforcement-learning	—Unverified	0
Actor-Critic for Linearly-Solvable Continuous MDP with Partially Known Dynamics	Jun 4, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Interpolated Policy Gradient: Merging On-Policy and Off-Policy Gradient Estimation for Deep Reinforcement Learning	Jun 1, 2017	continuous-controlContinuous Control	—Unverified	0
Reinforcement Learning for Learning Rate Control	May 31, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
The Atari Grand Challenge Dataset	May 31, 2017	Imitation LearningReinforcement Learning	CodeCode Available	0
Sequential Dynamic Decision Making with Deep Neural Nets on a Test-Time Budget	May 31, 2017	Decision MakingFeature Engineering	—Unverified	0
Universal Reinforcement Learning Algorithms: Survey and Experiments	May 30, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Constrained Policy Optimization	May 30, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Fine-grained acceleration control for autonomous intersection management using deep reinforcement learning	May 30, 2017	Autonomous VehiclesDeep Reinforcement Learning	—Unverified	0
Experience Replay Using Transition Sequences	May 30, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Objective-Reinforced Generative Adversarial Networks (ORGAN) for Sequence Generation Models	May 30, 2017	Molecular Graph GenerationMusic Generation	CodeCode Available	0
End-to-end Active Object Tracking via Reinforcement Learning	May 30, 2017	Deep Reinforcement LearningObject	—Unverified	0
Free energy-based reinforcement learning using a quantum processor	May 29, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Latent Intention Dialogue Models	May 29, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Role Playing Learning for Socially Concomitant Mobile Robot Navigation	May 29, 2017	NavigateReinforcement Learning	—Unverified	0
Boltzmann Exploration Done Right	May 29, 2017	Decision MakingDecision Making Under Uncertainty	—Unverified	0
Cross-Domain Perceptual Reward Functions	May 25, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
First-spike based visual categorization using reward-modulated STDP	May 25, 2017	Game of GoObject Recognition	—Unverified	0
State Space Decomposition and Subgoal Creation for Transfer in Deep Reinforcement Learning	May 24, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Continuous State-Space Models for Optimal Sepsis Treatment - a Deep Reinforcement Learning Approach	May 23, 2017	Decision MakingDeep Reinforcement Learning	—Unverified	0
Enhanced Experience Replay Generation for Efficient Reinforcement Learning	May 23, 2017	Deep Reinforcement LearningGenerative Adversarial Network	—Unverified	0
Visual Semantic Planning using Deep Successor Representations	May 23, 2017	Imitation LearningReinforcement Learning	—Unverified	0
Reinforcement Learning with a Corrupted Reward Channel	May 23, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Safe Model-based Reinforcement Learning with Stability Guarantees	May 23, 2017	modelModel-based Reinforcement Learning	CodeCode Available	0
Thinking Fast and Slow with Deep Learning and Tree Search	May 23, 2017	Decision MakingDeep Learning	CodeCode Available	1
A unified view of entropy-regularized Markov decision processes	May 22, 2017	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Concrete Dropout	May 22, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
AIXIjs: A Software Demo for General Reinforcement Learning	May 22, 2017	General Reinforcement LearningOpenAI Gym	CodeCode Available	0
Guide Actor-Critic for Continuous Control	May 22, 2017	continuous-controlContinuous Control	CodeCode Available	0
Ask the Right Questions: Active Question Reformulation with Reinforcement Learning	May 22, 2017	Information RetrievalQuestion Answering	CodeCode Available	0
Experience enrichment based task independent reward model	May 21, 2017	modelreinforcement-learning	—Unverified	0
Learning to Mix n-Step Returns: Generalizing lambda-Returns for Deep Reinforcement Learning	May 21, 2017	BenchmarkingDecision Making	—Unverified	0
Shallow Updates for Deep Reinforcement Learning	May 21, 2017	Atari GamesDeep Reinforcement Learning	—Unverified	0
Learning to Factor Policies and Action-Value Functions: Factored Action Space Representations for Deep Reinforcement learning	May 20, 2017	Decision MakingDeep Reinforcement Learning	—Unverified	0
Batch Reinforcement Learning on the Industrial Benchmark: First Experiences	May 20, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Atari games and Intel processors	May 19, 2017	Atari GamesBIG-bench Machine Learning	—Unverified	0
A Comparison of Reinforcement Learning Techniques for Fuzzy Cloud Auto-Scaling	May 19, 2017	ManagementQ-Learning	—Unverified	0
Posterior sampling for reinforcement learning: worst-case regret bounds	May 19, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Delving into adversarial attacks on deep policies	May 18, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Feature Control as Intrinsic Motivation for Hierarchical Reinforcement Learning	May 18, 2017	Hierarchical Reinforcement LearningMontezuma's Revenge	CodeCode Available	0
ParlAI: A Dialog Research Software Platform	May 18, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	1
Automatic Goal Generation for Reinforcement Learning Agents	May 17, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
New Reinforcement Learning Using a Chaotic Neural Network for Emergence of "Thinking" - "Exploration" Grows into "Thinking" through Learning -	May 16, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Emotion in Reinforcement Learning Agents and Robots: A Survey	May 15, 2017	AI AgentDecision Making	—Unverified	0
Repeated Inverse Reinforcement Learning	May 15, 2017	Imitation Learningreinforcement-learning	—Unverified	0
Efficient Parallel Methods for Deep Reinforcement Learning	May 13, 2017	Deep Reinforcement LearningGPU	CodeCode Available	0
A Deep Reinforced Model for Abstractive Summarization	May 11, 2017	Abstractive Text SummarizationDecoder	CodeCode Available	1
Policy Iterations for Reinforcement Learning Problems in Continuous Time and Space -- Fundamental Theory and Methods	May 9, 2017	Decision MakingQ-Learning	CodeCode Available	0

Show:10 25 50

← PrevPage 289 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified