Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11501–11550 of 15113 papers

Title	Date	Tasks	Status
Deep Reinforcement Learning with Smooth Policy	Jan 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Improving the Generalization of Visual Navigation Policies using Invariance Regularization	Jan 1, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Breaking the Curse of Many Agents: Provable Mean Embedding Q-Iteration for Mean-Field Reinforcement Learning	Jan 1, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Long-Term Visitation Value for Deep Exploration in Sparse Reward Reinforcement Learning	Jan 1, 2020	Benchmarkingreinforcement-learning	CodeCode Available
Double Reinforcement Learning for Efficient and Robust Off-Policy Evaluation	Jan 1, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Deep Reinforcement Learning with Implicit Human Feedback	Jan 1, 2020	Atari GamesDeep Reinforcement Learning	—Unverified
OPtions as REsponses: Grounding behavioural hierarchies in multi-agent reinforcement learning	Jan 1, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Reinforcement Learning with Goal-Distance Gradient	Jan 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Optimizing Multiagent Cooperation via Policy Evolution and Shared Experiences	Jan 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
“Other-Play” for Zero-Shot Coordination	Jan 1, 2020	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Way Off-Policy Batch Deep Reinforcement Learning of Human Preferences in Dialog	Jan 1, 2020	Deep Reinforcement LearningOpenAI Gym	—Unverified
Reinforcement Learning with Differential Privacy	Jan 1, 2020	Decision MakingPrivacy Preserving	—Unverified
Responsive Safety in Reinforcement Learning	Jan 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
The Natural Lottery Ticket Winner: Reinforcement Learning with Ordinary Neural Circuits	Jan 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
SVQN: Sequential Variational Soft Q-Learning Networks	Jan 1, 2020	Decision MakingQ-Learning	—Unverified
Reward-Conditioned Policies	Dec 31, 2019	Imitation Learningreinforcement-learning	CodeCode Available
Uncertainty-Based Out-of-Distribution Classification in Deep Reinforcement Learning	Dec 31, 2019	Bayesian InferenceClassification	—Unverified
The Gambler's Problem and Beyond	Dec 31, 2019	Q-Learningreinforcement-learning	—Unverified
Information Theoretic Model Predictive Q-Learning	Dec 31, 2019	Decision Makingmodel	—Unverified
A New Framework for Query Efficient Active Imitation Learning	Dec 30, 2019	Imitation LearningReinforcement Learning	—Unverified
Deep Reinforced Self-Attention Masks for Abstractive Summarization (DR.SAS)	Dec 30, 2019	Abstractive Text SummarizationReinforcement Learning	—Unverified
World Programs for Model-Based Learning and Planning in Compositional State and Action Spaces	Dec 30, 2019	reinforcement-learningReinforcement Learning	—Unverified
Speeding up reinforcement learning by combining attention and agency features	Dec 29, 2019	Atari Gamesreinforcement-learning	—Unverified
Real-time Policy Distillation in Deep Reinforcement Learning	Dec 29, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Augmented Replay Memory in Reinforcement Learning With Continuous Control	Dec 29, 2019	continuous-controlContinuous Control	—Unverified
Individual specialization in multi-task environments with multiagent reinforcement learners	Dec 29, 2019	FairnessMulti-agent Reinforcement Learning	—Unverified
Computational model discovery with reinforcement learning	Dec 29, 2019	Deep Reinforcement Learningmodel	—Unverified
SLM Lab: A Comprehensive Benchmark and Modular Software Framework for Reproducible Deep Reinforcement Learning	Dec 28, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Weak Supervision for Fake News Detection via Reinforcement Learning	Dec 28, 2019	ArticlesFake News Detection	CodeCode Available
Quantum Logic Gate Synthesis as a Markov Decision Process	Dec 27, 2019	reinforcement-learningReinforcement Learning	—Unverified
Evolution Strategies Converges to Finite Differences	Dec 27, 2019	reinforcement-learningReinforcement Learning	—Unverified
Crowdfunding Dynamics Tracking: A Reinforcement Learning Approach	Dec 27, 2019	continuous-controlContinuous Control	—Unverified
Deep reinforcement learning for complex evaluation of one-loop diagrams in quantum field theory	Dec 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Quasi-Newton Trust Region Policy Optimization	Dec 26, 2019	continuous-controlContinuous Control	—Unverified
Learning to Combat Compounding-Error in Model-Based Reinforcement Learning	Dec 24, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Learning to Navigate Using Mid-Level Visual Priors	Dec 23, 2019	Navigatereinforcement-learning	CodeCode Available
A Survey of Deep Reinforcement Learning in Video Games	Dec 23, 2019	Deep Reinforcement LearningReal-Time Strategy Games	—Unverified
Discrete and Continuous Action Representation for Practical RL in Video Games	Dec 23, 2019	Control with Prametrised ActionsReinforcement Learning	CodeCode Available
Hamilton-Jacobi-Bellman Equations for Q-Learning in Continuous Time	Dec 23, 2019	Q-Learningreinforcement-learning	—Unverified
Explain Your Move: Understanding Agent Actions Using Specific and Relevant Feature Attribution	Dec 23, 2019	Atari GamesBoard Games	CodeCode Available
Direct and indirect reinforcement learning	Dec 23, 2019	Decision Makingreinforcement-learning	—Unverified
Variational Recurrent Models for Solving Partially Observable Control Tasks	Dec 23, 2019	Deep Reinforcement LearningMemorization	CodeCode Available
Parameterized Indexed Value Function for Efficient Exploration in Reinforcement Learning	Dec 23, 2019	Efficient Explorationreinforcement-learning	CodeCode Available
Towards Practical Multi-Object Manipulation using Relational Reinforcement Learning	Dec 23, 2019	Objectreinforcement-learning	CodeCode Available
Monte-Carlo Tree Search for Policy Optimization	Dec 23, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Energy-Aware Multi-Server Mobile Edge Computing: A Deep Reinforcement Learning Approach	Dec 22, 2019	Deep Reinforcement LearningEdge-computing	—Unverified
Can Agents Learn by Analogy? An Inferable Model for PAC Reinforcement Learning	Dec 21, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Predictive Coding for Boosting Deep Reinforcement Learning with Sparse Rewards	Dec 21, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Online Reinforcement Learning of Optimal Threshold Policies for Markov Decision Processes	Dec 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
Teaching robots to perceive time -- A reinforcement learning approach (Extended version)	Dec 20, 2019	Gaussian Processesreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 231 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified