Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14151–14200 of 15113 papers

Title	Date	Tasks	Status
Interpretable Policies for Reinforcement Learning by Genetic Programming	Dec 12, 2017	regressionreinforcement-learning	—Unverified
A Low-Cost Ethics Shaping Approach for Designing Reinforcement Learning Agents	Dec 12, 2017	Ethicsreinforcement-learning	CodeCode Available
The Eigenoption-Critic Framework	Dec 11, 2017	Efficient ExplorationHierarchical Reinforcement Learning	—Unverified
MINOS: Multimodal Indoor Simulator for Navigation in Complex Environments	Dec 11, 2017	Deep Reinforcement LearningNavigate	CodeCode Available
Robust Deep Reinforcement Learning with Adversarial Attacks	Dec 11, 2017	Deep Reinforcement LearningQ-Learning	—Unverified
Stochastic Answer Networks for Machine Reading Comprehension	Dec 10, 2017	Machine Reading ComprehensionQuestion Answering	CodeCode Available
Reinforced dynamics for enhanced sampling in large atomic and molecular systems	Dec 10, 2017	Deep Reinforcement LearningEfficient Exploration	—Unverified
Deep Primal-Dual Reinforcement Learning: Accelerating Actor-Critic using Bellman Duality	Dec 7, 2017	Q-Learningreinforcement-learning	—Unverified
End-to-End Offline Goal-Oriented Dialog Policy Learning via Policy Gradient	Dec 7, 2017	DecoderGoal-Oriented Dialog	—Unverified
Noisy Natural Gradient as Variational Inference	Dec 6, 2017	Active LearningEfficient Exploration	CodeCode Available
A Deeper Look at Experience Replay	Dec 4, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available
Interactive Reinforcement Learning for Object Grounding via Self-Talking	Dec 2, 2017	Objectreinforcement-learning	—Unverified
MAgent: A Many-Agent Reinforcement Learning Platform for Artificial Collective Intelligence	Dec 2, 2017	GPUMulti-agent Reinforcement Learning	CodeCode Available
Representation and Reinforcement Learning for Personalized Glycemic Control in Septic Patients	Dec 2, 2017	reinforcement-learningReinforcement Learning	—Unverified
Progressive Neural Architecture Search	Dec 2, 2017	Evolutionary AlgorithmsGeneral Classification	CodeCode Available
Online Reinforcement Learning in Stochastic Games	Dec 2, 2017	reinforcement-learningReinforcement Learning	—Unverified
Optimistic posterior sampling for reinforcement learning: worst-case regret bounds	Dec 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Q-LDA: Uncovering Latent Patterns in Text-based Sequential Decision Processes	Dec 1, 2017	Decision MakingDeep Reinforcement Learning	—Unverified
Natural Value Approximators: Learning when to Trust Past Estimates	Dec 1, 2017	Atari GamesInductive Bias	—Unverified
Data-Efficient Reinforcement Learning in Continuous State-Action Gaussian-POMDPs	Dec 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Log-normality and Skewness of Estimated State/Action Values in Reinforcement Learning	Dec 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Dynamic-Depth Context Tree Weighting	Dec 1, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Adaptive Batch Size for Safe Policy Gradients	Dec 1, 2017	Policy Gradient MethodsReinforcement Learning	—Unverified
Compatible Reward Inverse Reinforcement Learning	Dec 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Improved Learning in Evolution Strategies via Sparser Inter-Agent Network Topologies	Nov 30, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Embodied Question Answering	Nov 30, 2017	Embodied Question AnsweringNavigate	CodeCode Available
Comparing Deep Reinforcement Learning and Evolutionary Methods in Continuous Control	Nov 30, 2017	continuous-controlContinuous Control	—Unverified
Transferring Autonomous Driving Knowledge on Simulated and Real Intersections	Nov 30, 2017	Autonomous DrivingAutonomous Vehicles	—Unverified
Safe Exploration for Identifying Linear Systems via Robust Optimization	Nov 30, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Video Captioning via Hierarchical Reinforcement Learning	Nov 29, 2017	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning To Adapt Speech Enhancement to Instantaneous Input Signal Quality	Nov 29, 2017	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for De-Novo Drug Design	Nov 29, 2017	Deep Reinforcement LearningDrug Design	CodeCode Available
Can Complex Collective Behaviour Be Generated Through Randomness, Memory and a Pinch of Luck?	Nov 29, 2017	reinforcement-learningReinforcement Learning (RL)	—Unverified
Automating Vehicles by Deep Reinforcement Learning using Task Separation with Hill Climbing	Nov 29, 2017	Autonomous DrivingDeep Reinforcement Learning	—Unverified
A Benchmarking Environment for Reinforcement Learning Based Task Oriented Dialogue Management	Nov 29, 2017	BenchmarkingDeep Reinforcement Learning	—Unverified
End-to-End Optimization of Task-Oriented Dialogue Model with Deep Reinforcement Learning	Nov 29, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
HoME: a Household Multimodal Environment	Nov 29, 2017	OpenAI Gymreinforcement-learning	—Unverified
Crossmodal Attentive Skill Learner	Nov 28, 2017	Atari GamesCPU	CodeCode Available
Hierarchical Policy Search via Return-Weighted Density Estimation	Nov 28, 2017	Density EstimationMotion Planning	—Unverified
Learning from Longitudinal Face Demonstration - Where Tractable Deep Modeling Meets Inverse Reinforcement Learning	Nov 28, 2017	Face VerificationMORPH	—Unverified
A reinforcement learning algorithm for building collaboration in multi-agent systems	Nov 28, 2017	Q-Learningreinforcement-learning	—Unverified
Risk-sensitive Inverse Reinforcement Learning via Semi- and Non-Parametric Methods	Nov 28, 2017	Decision Makingreinforcement-learning	CodeCode Available
Deep Reinforcement Learning for Sepsis Treatment	Nov 27, 2017	Decision MakingDeep Reinforcement Learning	CodeCode Available
Divide-and-Conquer Reinforcement Learning	Nov 27, 2017	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
AI Safety Gridworlds	Nov 27, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Generative Adversarial Network for Abstractive Text Summarization	Nov 26, 2017	Abstractive Text SummarizationGenerative Adversarial Network	CodeCode Available
Malaria Likelihood Prediction By Effectively Surveying Households Using Deep Reinforcement Learning	Nov 25, 2017	Deep Reinforcement LearningHoldout Set	—Unverified
Ethical Challenges in Data-Driven Dialogue Systems	Nov 24, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Cascade Attribute Learning Network	Nov 24, 2017	AttributePosition	—Unverified
Asking the Difficult Questions: Goal-Oriented Visual Question Generation via Intermediate Rewards	Nov 21, 2017	Deep Reinforcement LearningInformativeness	—Unverified

Show:10 25 50

← PrevPage 284 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified