Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13951–14000 of 15113 papers

Title	Date	Tasks	Status	Hype
Efficient Exploration through Bayesian Deep Q-Networks	Feb 13, 2018	Atari GamesEfficient Exploration	CodeCode Available	0
Diversity-Driven Exploration Strategy for Deep Reinforcement Learning	Feb 13, 2018	Deep Reinforcement LearningDiversity	—Unverified	0
Progressive Reinforcement Learning with Distillation for Multi-Skilled Motion Control	Feb 13, 2018	continuous-controlContinuous Control	—Unverified	0
Evolved Policy Gradients	Feb 13, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
A Deep Reinforcement Learning Framework for Rebalancing Dockless Bike Sharing Systems	Feb 13, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning	Feb 12, 2018	Efficient Explorationreinforcement-learning	CodeCode Available	0
Reinforcement Learning with Wasserstein Distance Regularisation, with Applications to Multipolicy Learning	Feb 12, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning for Solving the Vehicle Routing Problem	Feb 12, 2018	Combinatorial Optimizationreinforcement-learning	CodeCode Available	0
M-Walk: Learning to Walk over Graphs using Monte Carlo Tree Search	Feb 12, 2018	Knowledge Base CompletionLink Prediction	—Unverified	0
Efficient Model-Based Deep Reinforcement Learning with Variational State Tabulation	Feb 12, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Sample Efficient Deep Reinforcement Learning for Dialogue Systems with Large Action Spaces	Feb 11, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
More Robust Doubly Robust Off-policy Evaluation	Feb 10, 2018	Multi-Armed BanditsOff-policy evaluation	—Unverified	0
Beyond the One Step Greedy Approach in Reinforcement Learning	Feb 10, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Balancing Two-Player Stochastic Games with Soft Q-Learning	Feb 9, 2018	Q-LearningReinforcement Learning	—Unverified	0
Learning and Querying Fast Generative Models for Reinforcement Learning	Feb 8, 2018	Atari GamesDecision Making	—Unverified	0
Precision medicine as a control problem: Using simulation and deep reinforcement learning to discover adaptive, personalized multi-cytokine therapy for sepsis	Feb 8, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Critical Investigation of Deep Reinforcement Learning for Navigation	Feb 7, 2018	Deep Reinforcement LearningNavigate	CodeCode Available	0
From Game-theoretic Multi-agent Log Linear Learning to Reinforcement Learning	Feb 7, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Efficient collective swimming by harnessing vortices through deep reinforcement learning	Feb 7, 2018	Deep Reinforcement LearningNavigate	—Unverified	0
Deep Reinforcement Learning for Image Hashing	Feb 7, 2018	Deep HashingDeep Reinforcement Learning	—Unverified	0
Decomposition Methods with Deep Corrections for Reinforcement Learning	Feb 6, 2018	Autonomous DrivingDecision Making	CodeCode Available	0
Shared Autonomy via Deep Reinforcement Learning	Feb 6, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures	Feb 5, 2018	Atari Gamesreinforcement-learning	CodeCode Available	1
Coordinated Exploration in Concurrent Reinforcement Learning	Feb 5, 2018	Diversityreinforcement-learning	—Unverified	0
Multimodal Sentiment Analysis with Word-Level Fusion and Reinforcement Learning	Feb 3, 2018	Multimodal Sentiment Analysisreinforcement-learning	CodeCode Available	0
Multi-task Learning for Continuous Control	Feb 3, 2018	continuous-controlContinuous Control	—Unverified	0
Elements of Effective Deep Reinforcement Learning towards Tactical Driving Decision Making	Feb 1, 2018	Autonomous DrivingDecision Making	—Unverified	0
Deep Reinforcement Learning for Programming Language Correction	Jan 31, 2018	Deep Reinforcement LearningMachine Translation	CodeCode Available	0
Pretraining Deep Actor-Critic Reinforcement Learning Algorithms With Expert Demonstrations	Jan 31, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Barrier-Certified Adaptive Reinforcement Learning with Applications to Brushbot Navigation	Jan 29, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning using Capsules in Advanced Game Environments	Jan 29, 2018	Deep Reinforcement LearningGeneral Classification	—Unverified	0
Learning the Reward Function for a Misspecified Model	Jan 29, 2018	modelModel-based Reinforcement Learning	CodeCode Available	0
Deep Reinforcement Learning for Dynamic Treatment Regimes on Medical Registry Data	Jan 28, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
FlashRL: A Reinforcement Learning Platform for Flash Games	Jan 26, 2018	CPUDiversity	—Unverified	0
Safe Exploration in Continuous Action Spaces	Jan 26, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Directly Estimating the Variance of the λ-Return Using Temporal-Difference Methods	Jan 25, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Psychlab: A Psychology Laboratory for Deep Reinforcement Learning Agents	Jan 24, 2018	Change DetectionDeep Reinforcement Learning	CodeCode Available	0
Logically-Constrained Reinforcement Learning	Jan 24, 2018	Decision MakingDecision Making Under Uncertainty	CodeCode Available	1
Analyzing Language Learned by an Active Question Answering Agent	Jan 23, 2018	Information RetrievalQuestion Answering	—Unverified	0
Curiosity-driven reinforcement learning with homeostatic regulation	Jan 23, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Cross-Domain Transfer in Reinforcement Learning using Target Apprentice	Jan 22, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
A Deep Reinforcement Learning Chatbot (Short Version)	Jan 20, 2018	ChatbotDeep Reinforcement Learning	—Unverified	0
Learning model-based strategies in simple environments with hierarchical q-networks	Jan 20, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning	Jan 18, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Experience-driven Networking: A Deep Reinforcement Learning based Approach	Jan 17, 2018	continuous-controlContinuous Control	—Unverified	0
The Case for Automatic Database Administration using Deep Reinforcement Learning	Jan 17, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning based Recommender System using Biclustering Technique	Jan 17, 2018	Recommendation Systemsreinforcement-learning	—Unverified	0
The QLBS Q-Learner Goes NuQLear: Fitted Q Iteration, Inverse RL, and Option Portfolios	Jan 17, 2018	Q-Learningreinforcement-learning	—Unverified	0
Cellular-Connected UAVs over 5G: Deep Reinforcement Learning for Interference Management	Jan 16, 2018	Deep Reinforcement LearningManagement	—Unverified	0
GitGraph - Architecture Search Space Creation through Frequent Computational Subgraph Mining	Jan 16, 2018	Evolutionary AlgorithmsNeural Architecture Search	—Unverified	0

Show:10 25 50

← PrevPage 280 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified