Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14001–14050 of 15113 papers

Title	Date	Tasks	Status
Back to Basics: Benchmarking Canonical Evolution Strategies for Playing Atari	Feb 24, 2018	Atari GamesBenchmarking	CodeCode Available
Budget Constrained Bidding by Model-free Reinforcement Learning in Display Advertising	Feb 23, 2018	Marketingreinforcement-learning	—Unverified
Verifying Controllers Against Adversarial Examples with Bayesian Optimization	Feb 23, 2018	Bayesian Optimizationreinforcement-learning	CodeCode Available
Ranking Sentences for Extractive Summarization with Reinforcement Learning	Feb 23, 2018	Document SummarizationExtractive Summarization	CodeCode Available
Weighted Double Deep Multiagent Reinforcement Learning in Stochastic Cooperative Environments	Feb 23, 2018	Deep Reinforcement LearningQ-Learning	—Unverified
Structured Control Nets for Deep Reinforcement Learning	Feb 22, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available
Diverse Exploration for Fast and Safe Policy Improvement	Feb 22, 2018	Diversityreinforcement-learning	—Unverified
An Analysis of Categorical Distributional Reinforcement Learning	Feb 22, 2018	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Variational Inference for Policy Gradient	Feb 21, 2018	reinforcement-learningReinforcement Learning	—Unverified
Continual Reinforcement Learning with Complex Synapses	Feb 20, 2018	Continual LearningDeep Reinforcement Learning	—Unverified
Fourier Policy Gradients	Feb 19, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Accelerated Primal-Dual Policy Optimization for Safe Reinforcement Learning	Feb 19, 2018	reinforcement-learningReinforcement Learning	—Unverified
Recommendations with Negative Feedback via Pairwise Deep Reinforcement Learning	Feb 19, 2018	Deep Reinforcement LearningRecommendation Systems	—Unverified
Estimating scale-invariant future in continuous time	Feb 18, 2018	reinforcement-learningReinforcement Learning	—Unverified
Efficient Collaborative Multi-Agent Deep Reinforcement Learning for Large-Scale Fleet Management	Feb 18, 2018	Deep Reinforcement LearningManagement	CodeCode Available
Improving Mild Cognitive Impairment Prediction via Reinforcement Learning and Dialogue Simulation	Feb 18, 2018	reinforcement-learningReinforcement Learning	—Unverified
Bridging Cognitive Programs and Machine Learning	Feb 16, 2018	BIG-bench Machine Learningreinforcement-learning	—Unverified
Monte Carlo Q-learning for General Game Playing	Feb 16, 2018	Board GamesQ-Learning	CodeCode Available
Reactive Reinforcement Learning in Asynchronous Environments	Feb 16, 2018	Decision Makingreinforcement-learning	—Unverified
Modeling the Formation of Social Conventions from Embodied Real-Time Interactions	Feb 16, 2018	Decision MakingFairness	—Unverified
Prioritized Sweeping Neural DynaQ with Multiple Predecessors, and Hippocampal Replays	Feb 15, 2018	HippocampusQ-Learning	—Unverified
Reinforcement Learning from Imperfect Demonstrations	Feb 14, 2018	reinforcement-learningReinforcement Learning	—Unverified
GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms	Feb 14, 2018	Deep Reinforcement LearningDiversity	CodeCode Available
From Gameplay to Symbolic Reasoning: Learning SAT Solver Heuristics in the Style of Alpha(Go) Zero	Feb 14, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available
Diversity-Driven Exploration Strategy for Deep Reinforcement Learning	Feb 13, 2018	Deep Reinforcement LearningDiversity	—Unverified
A Deep Reinforcement Learning Framework for Rebalancing Dockless Bike Sharing Systems	Feb 13, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Evolved Policy Gradients	Feb 13, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Efficient Exploration through Bayesian Deep Q-Networks	Feb 13, 2018	Atari GamesEfficient Exploration	CodeCode Available
Progressive Reinforcement Learning with Distillation for Multi-Skilled Motion Control	Feb 13, 2018	continuous-controlContinuous Control	—Unverified
M-Walk: Learning to Walk over Graphs using Monte Carlo Tree Search	Feb 12, 2018	Knowledge Base CompletionLink Prediction	—Unverified
Reinforcement Learning for Solving the Vehicle Routing Problem	Feb 12, 2018	Combinatorial Optimizationreinforcement-learning	CodeCode Available
Efficient Model-Based Deep Reinforcement Learning with Variational State Tabulation	Feb 12, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforcement Learning with Wasserstein Distance Regularisation, with Applications to Multipolicy Learning	Feb 12, 2018	reinforcement-learningReinforcement Learning	—Unverified
Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning	Feb 12, 2018	Efficient Explorationreinforcement-learning	CodeCode Available
Sample Efficient Deep Reinforcement Learning for Dialogue Systems with Large Action Spaces	Feb 11, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
More Robust Doubly Robust Off-policy Evaluation	Feb 10, 2018	Multi-Armed BanditsOff-policy evaluation	—Unverified
Beyond the One Step Greedy Approach in Reinforcement Learning	Feb 10, 2018	reinforcement-learningReinforcement Learning	—Unverified
Balancing Two-Player Stochastic Games with Soft Q-Learning	Feb 9, 2018	Q-LearningReinforcement Learning	—Unverified
Learning and Querying Fast Generative Models for Reinforcement Learning	Feb 8, 2018	Atari GamesDecision Making	—Unverified
Precision medicine as a control problem: Using simulation and deep reinforcement learning to discover adaptive, personalized multi-cytokine therapy for sepsis	Feb 8, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
From Game-theoretic Multi-agent Log Linear Learning to Reinforcement Learning	Feb 7, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Critical Investigation of Deep Reinforcement Learning for Navigation	Feb 7, 2018	Deep Reinforcement LearningNavigate	CodeCode Available
Deep Reinforcement Learning for Image Hashing	Feb 7, 2018	Deep HashingDeep Reinforcement Learning	—Unverified
Efficient collective swimming by harnessing vortices through deep reinforcement learning	Feb 7, 2018	Deep Reinforcement LearningNavigate	—Unverified
Decomposition Methods with Deep Corrections for Reinforcement Learning	Feb 6, 2018	Autonomous DrivingDecision Making	CodeCode Available
Shared Autonomy via Deep Reinforcement Learning	Feb 6, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Coordinated Exploration in Concurrent Reinforcement Learning	Feb 5, 2018	Diversityreinforcement-learning	—Unverified
Multimodal Sentiment Analysis with Word-Level Fusion and Reinforcement Learning	Feb 3, 2018	Multimodal Sentiment Analysisreinforcement-learning	CodeCode Available
Multi-task Learning for Continuous Control	Feb 3, 2018	continuous-controlContinuous Control	—Unverified
Elements of Effective Deep Reinforcement Learning towards Tactical Driving Decision Making	Feb 1, 2018	Autonomous DrivingDecision Making	—Unverified

Show:10 25 50

← PrevPage 281 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified