Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14101–14150 of 15113 papers

Title	Date	Tasks	Status	Hype
MAgent: A Many-Agent Reinforcement Learning Platform for Artificial Collective Intelligence	Dec 2, 2017	GPUMulti-agent Reinforcement Learning	CodeCode Available	0
Online Reinforcement Learning in Stochastic Games	Dec 2, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Progressive Neural Architecture Search	Dec 2, 2017	Evolutionary AlgorithmsGeneral Classification	CodeCode Available	0
Natural Value Approximators: Learning when to Trust Past Estimates	Dec 1, 2017	Atari GamesInductive Bias	—Unverified	0
Log-normality and Skewness of Estimated State/Action Values in Reinforcement Learning	Dec 1, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Optimistic posterior sampling for reinforcement learning: worst-case regret bounds	Dec 1, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Q-LDA: Uncovering Latent Patterns in Text-based Sequential Decision Processes	Dec 1, 2017	Decision MakingDeep Reinforcement Learning	—Unverified	0
Adaptive Batch Size for Safe Policy Gradients	Dec 1, 2017	Policy Gradient MethodsReinforcement Learning	—Unverified	0
Data-Efficient Reinforcement Learning in Continuous State-Action Gaussian-POMDPs	Dec 1, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Dynamic-Depth Context Tree Weighting	Dec 1, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Compatible Reward Inverse Reinforcement Learning	Dec 1, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Time Limits in Reinforcement Learning	Dec 1, 2017	General Reinforcement Learningreinforcement-learning	CodeCode Available	1
Safe Exploration for Identifying Linear Systems via Robust Optimization	Nov 30, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Transferring Autonomous Driving Knowledge on Simulated and Real Intersections	Nov 30, 2017	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Embodied Question Answering	Nov 30, 2017	Embodied Question AnsweringNavigate	CodeCode Available	0
Improved Learning in Evolution Strategies via Sparser Inter-Agent Network Topologies	Nov 30, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Comparing Deep Reinforcement Learning and Evolutionary Methods in Continuous Control	Nov 30, 2017	continuous-controlContinuous Control	—Unverified	0
Can Complex Collective Behaviour Be Generated Through Randomness, Memory and a Pinch of Luck?	Nov 29, 2017	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
HoME: a Household Multimodal Environment	Nov 29, 2017	OpenAI Gymreinforcement-learning	—Unverified	0
End-to-End Optimization of Task-Oriented Dialogue Model with Deep Reinforcement Learning	Nov 29, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Automating Vehicles by Deep Reinforcement Learning using Task Separation with Hill Climbing	Nov 29, 2017	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Reinforcement Learning To Adapt Speech Enhancement to Instantaneous Input Signal Quality	Nov 29, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Video Captioning via Hierarchical Reinforcement Learning	Nov 29, 2017	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
A Benchmarking Environment for Reinforcement Learning Based Task Oriented Dialogue Management	Nov 29, 2017	BenchmarkingDeep Reinforcement Learning	—Unverified	0
Deep Reinforcement Learning for De-Novo Drug Design	Nov 29, 2017	Deep Reinforcement LearningDrug Design	CodeCode Available	0
Hierarchical Policy Search via Return-Weighted Density Estimation	Nov 28, 2017	Density EstimationMotion Planning	—Unverified	0
One-Shot Reinforcement Learning for Robot Navigation with Interactive Replay	Nov 28, 2017	Navigatereinforcement-learning	CodeCode Available	1
Plan, Attend, Generate: Planning for Sequence-to-Sequence Models	Nov 28, 2017	Question GenerationQuestion-Generation	CodeCode Available	1
Learning from Longitudinal Face Demonstration - Where Tractable Deep Modeling Meets Inverse Reinforcement Learning	Nov 28, 2017	Face VerificationMORPH	—Unverified	0
Risk-sensitive Inverse Reinforcement Learning via Semi- and Non-Parametric Methods	Nov 28, 2017	Decision Makingreinforcement-learning	CodeCode Available	0
A reinforcement learning algorithm for building collaboration in multi-agent systems	Nov 28, 2017	Q-Learningreinforcement-learning	—Unverified	0
Crossmodal Attentive Skill Learner	Nov 28, 2017	Atari GamesCPU	CodeCode Available	0
Deep Reinforcement Learning for Sepsis Treatment	Nov 27, 2017	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
AI Safety Gridworlds	Nov 27, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Divide-and-Conquer Reinforcement Learning	Nov 27, 2017	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available	0
Generative Adversarial Network for Abstractive Text Summarization	Nov 26, 2017	Abstractive Text SummarizationGenerative Adversarial Network	CodeCode Available	0
Malaria Likelihood Prediction By Effectively Surveying Households Using Deep Reinforcement Learning	Nov 25, 2017	Deep Reinforcement LearningHoldout Set	—Unverified	0
Ethical Challenges in Data-Driven Dialogue Systems	Nov 24, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Cascade Attribute Learning Network	Nov 24, 2017	AttributePosition	—Unverified	0
Action Branching Architectures for Deep Reinforcement Learning	Nov 24, 2017	continuous-controlContinuous Control	CodeCode Available	1
Asking the Difficult Questions: Goal-Oriented Visual Question Generation via Intermediate Rewards	Nov 21, 2017	Deep Reinforcement LearningInformativeness	—Unverified	0
Transferring Agent Behaviors from Videos via Motion GANs	Nov 21, 2017	General Reinforcement LearningGenerative Adversarial Network	—Unverified	0
Posterior Sampling for Large Scale Reinforcement Learning	Nov 21, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Teaching a Machine to Read Maps with Deep Reinforcement Learning	Nov 20, 2017	Deep Reinforcement LearningNavigate	CodeCode Available	0
Classification with Costly Features using Deep Reinforcement Learning	Nov 20, 2017	ClassificationClassification with Costly Features	CodeCode Available	0
Deep Reinforcement Learning for Multi-Resource Multi-Machine Job Scheduling	Nov 20, 2017	CPUDeep Reinforcement Learning	—Unverified	0
Leave no Trace: Learning to Reset for Safe and Autonomous Reinforcement Learning	Nov 18, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Run, skeleton, run: skeletal model in a physics-based simulation	Nov 18, 2017	NavigatePolicy Gradient Methods	CodeCode Available	0
Neural Network Based Reinforcement Learning for Audio-Visual Gaze Control in Human-Robot Interaction	Nov 18, 2017	parameter estimationQ-Learning	—Unverified	0
Hindsight policy gradients	Nov 16, 2017	Policy Gradient Methodsreinforcement-learning	CodeCode Available	0

Show:10 25 50

← PrevPage 283 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified