Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11301–11350 of 15113 papers

Title	Date	Tasks	Status	Hype
Optimizing Multiagent Cooperation via Policy Evolution and Shared Experiences	Jan 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Variational Imitation Learning with Diverse-quality Demonstrations	Jan 1, 2020	continuous-controlContinuous Control	CodeCode Available	1
Responsive Safety in Reinforcement Learning	Jan 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
OPtions as REsponses: Grounding behavioural hierarchies in multi-agent reinforcement learning	Jan 1, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
The Natural Lottery Ticket Winner: Reinforcement Learning with Ordinary Neural Circuits	Jan 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning with Differential Privacy	Jan 1, 2020	Decision MakingPrivacy Preserving	—Unverified	0
SVQN: Sequential Variational Soft Q-Learning Networks	Jan 1, 2020	Decision MakingQ-Learning	—Unverified	0
Long-Term Visitation Value for Deep Exploration in Sparse Reward Reinforcement Learning	Jan 1, 2020	Benchmarkingreinforcement-learning	CodeCode Available	0
Meta Reinforcement Learning with Autonomous Inference of Subtask Dependencies	Jan 1, 2020	Efficient ExplorationMeta Reinforcement Learning	CodeCode Available	1
Reinforcement Learning with Goal-Distance Gradient	Jan 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning with Implicit Human Feedback	Jan 1, 2020	Atari GamesDeep Reinforcement Learning	—Unverified	0
Learning Representations in Reinforcement Learning: an Information Bottleneck Approach	Jan 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Randomized Least Squares Value Iteration	Jan 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Improving the Generalization of Visual Navigation Policies using Invariance Regularization	Jan 1, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Way Off-Policy Batch Deep Reinforcement Learning of Human Preferences in Dialog	Jan 1, 2020	Deep Reinforcement LearningOpenAI Gym	—Unverified	0
Information Theoretic Model Predictive Q-Learning	Dec 31, 2019	Decision Makingmodel	—Unverified	0
The Gambler's Problem and Beyond	Dec 31, 2019	Q-Learningreinforcement-learning	—Unverified	0
Uncertainty-Based Out-of-Distribution Classification in Deep Reinforcement Learning	Dec 31, 2019	Bayesian InferenceClassification	—Unverified	0
Reward-Conditioned Policies	Dec 31, 2019	Imitation Learningreinforcement-learning	CodeCode Available	0
PAC Confidence Sets for Deep Neural Networks via Calibrated Prediction	Dec 31, 2019	Generalization BoundsLearning Theory	CodeCode Available	1
World Programs for Model-Based Learning and Planning in Compositional State and Action Spaces	Dec 30, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforced Self-Attention Masks for Abstractive Summarization (DR.SAS)	Dec 30, 2019	Abstractive Text SummarizationReinforcement Learning	—Unverified	0
A New Framework for Query Efficient Active Imitation Learning	Dec 30, 2019	Imitation LearningReinforcement Learning	—Unverified	0
Computational model discovery with reinforcement learning	Dec 29, 2019	Deep Reinforcement Learningmodel	—Unverified	0
Augmented Replay Memory in Reinforcement Learning With Continuous Control	Dec 29, 2019	continuous-controlContinuous Control	—Unverified	0
Individual specialization in multi-task environments with multiagent reinforcement learners	Dec 29, 2019	FairnessMulti-agent Reinforcement Learning	—Unverified	0
Real-time Policy Distillation in Deep Reinforcement Learning	Dec 29, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Speeding up reinforcement learning by combining attention and agency features	Dec 29, 2019	Atari Gamesreinforcement-learning	—Unverified	0
Weak Supervision for Fake News Detection via Reinforcement Learning	Dec 28, 2019	ArticlesFake News Detection	CodeCode Available	0
SLM Lab: A Comprehensive Benchmark and Modular Software Framework for Reproducible Deep Reinforcement Learning	Dec 28, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Evolution Strategies Converges to Finite Differences	Dec 27, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Deep reinforcement learning for complex evaluation of one-loop diagrams in quantum field theory	Dec 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Crowdfunding Dynamics Tracking: A Reinforcement Learning Approach	Dec 27, 2019	continuous-controlContinuous Control	—Unverified	0
Quantum Logic Gate Synthesis as a Markov Decision Process	Dec 27, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Quasi-Newton Trust Region Policy Optimization	Dec 26, 2019	continuous-controlContinuous Control	—Unverified	0
Learning to Combat Compounding-Error in Model-Based Reinforcement Learning	Dec 24, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Explain Your Move: Understanding Agent Actions Using Specific and Relevant Feature Attribution	Dec 23, 2019	Atari GamesBoard Games	CodeCode Available	0
A Survey of Deep Reinforcement Learning in Video Games	Dec 23, 2019	Deep Reinforcement LearningReal-Time Strategy Games	—Unverified	0
Hamilton-Jacobi-Bellman Equations for Q-Learning in Continuous Time	Dec 23, 2019	Q-Learningreinforcement-learning	—Unverified	0
Direct and indirect reinforcement learning	Dec 23, 2019	Decision Makingreinforcement-learning	—Unverified	0
Discrete and Continuous Action Representation for Practical RL in Video Games	Dec 23, 2019	Control with Prametrised ActionsReinforcement Learning	CodeCode Available	0
Learning to Navigate Using Mid-Level Visual Priors	Dec 23, 2019	Navigatereinforcement-learning	CodeCode Available	0
Monte-Carlo Tree Search for Policy Optimization	Dec 23, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Parameterized Indexed Value Function for Efficient Exploration in Reinforcement Learning	Dec 23, 2019	Efficient Explorationreinforcement-learning	CodeCode Available	0
Towards Practical Multi-Object Manipulation using Relational Reinforcement Learning	Dec 23, 2019	Objectreinforcement-learning	CodeCode Available	0
Variational Recurrent Models for Solving Partially Observable Control Tasks	Dec 23, 2019	Deep Reinforcement LearningMemorization	CodeCode Available	0
Energy-Aware Multi-Server Mobile Edge Computing: A Deep Reinforcement Learning Approach	Dec 22, 2019	Deep Reinforcement LearningEdge-computing	—Unverified	0
Predictive Coding for Boosting Deep Reinforcement Learning with Sparse Rewards	Dec 21, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Online Reinforcement Learning of Optimal Threshold Policies for Markov Decision Processes	Dec 21, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Can Agents Learn by Analogy? An Inferable Model for PAC Reinforcement Learning	Dec 21, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	0

Show:10 25 50

← PrevPage 227 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified