Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13151–13200 of 15113 papers

Title	Date	Tasks	Status
MEETING BOT: Reinforcement Learning for Dialogue Based Meeting Scheduling	Dec 28, 2018	reinforcement-learningReinforcement Learning	—Unverified
Quantum Adiabatic Algorithm Design using Reinforcement Learning	Dec 27, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Generative Adversarial User Model for Reinforcement Learning Based Recommendation System	Dec 27, 2018	Generative Adversarial NetworkModel-based Reinforcement Learning	CodeCode Available
Dealing with Limited Backhaul Capacity in Millimeter Wave Systems: A Deep Reinforcement Learning Approach	Dec 27, 2018	Deep Reinforcement LearningReinforcement Learning	—Unverified
A New Concept of Deep Reinforcement Learning based Augmented General Sequence Tagging System	Dec 26, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning to Walk via Deep Reinforcement Learning	Dec 26, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deconfounding Reinforcement Learning in Observational Settings	Dec 26, 2018	OpenAI Gymreinforcement-learning	CodeCode Available
Optimizing Market Making using Multi-Agent Reinforcement Learning	Dec 26, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
VMAV-C: A Deep Attention-based Reinforcement Learning Algorithm for Model-based Control	Dec 24, 2018	Deep AttentionModel-based Reinforcement Learning	—Unverified
Iroko: A Framework to Prototype Reinforcement Learning for Data Center Traffic Control	Dec 24, 2018	Deep Reinforcement LearningOpenAI Gym	CodeCode Available
Escape Room: A Configurable Testbed for Hierarchical Reinforcement Learning	Dec 22, 2018	Atari GamesHierarchical Reinforcement Learning	—Unverified
Learning to Navigate the Web	Dec 21, 2018	Deep Reinforcement LearningInstruction Following	—Unverified
NADPEx: An on-policy temporally consistent exploration method for deep reinforcement learning	Dec 21, 2018	continuous-controlContinuous Control	—Unverified
Pre-training with Non-expert Human Demonstration for Deep Reinforcement Learning	Dec 21, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Optimizing Quantum Error Correction Codes with Reinforcement Learning	Dec 20, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Review of Meta-Reinforcement Learning for Deep Neural Networks Architecture Search	Dec 20, 2018	Meta Reinforcement LearningNatural Language Understanding	—Unverified
TD-Regularized Actor-Critic Methods	Dec 19, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Universal Successor Features Approximators	Dec 18, 2018	NavigateReinforcement Learning	CodeCode Available
Information-Directed Exploration for Deep Reinforcement Learning	Dec 18, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available
Incentive-based demand response for smart grid with reinforcement learning and deep neural network	Dec 18, 2018	reinforcement-learningReinforcement Learning	—Unverified
Deep reinforcement learning for search, recommendation, and online advertising: a survey	Dec 18, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Domain Adaptation for Reinforcement Learning on the Atari	Dec 18, 2018	continuous-controlContinuous Control	—Unverified
An Atari Model Zoo for Analyzing, Visualizing, and Comparing Deep Reinforcement Learning Agents	Dec 17, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available
A Review of Meta-Reinforcement Learning for Deep Neural Networks Architecture Search	Dec 17, 2018	General ClassificationMeta Reinforcement Learning	—Unverified
Fuzzy Controller of Reward of Reinforcement Learning For Handwritten Digit Recognition	Dec 17, 2018	Handwriting RecognitionHandwritten Digit Recognition	—Unverified
Reinforcement Learning for Adaptive Caching with Dynamic Storage Pricing	Dec 17, 2018	Decision MakingQ-Learning	—Unverified
Malthusian Reinforcement Learning	Dec 17, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Decentralized Computation Offloading for Multi-User Mobile Edge Computing: A Deep Reinforcement Learning Approach	Dec 16, 2018	Deep Reinforcement LearningEdge-computing	CodeCode Available
Likelihood Quantile Networks for Coordinating Multi-Agent Reinforcement Learning	Dec 15, 2018	Multi-agent Reinforcement LearningPhilosophy	—Unverified
Residual Policy Learning	Dec 15, 2018	Deep Reinforcement LearningMuJoCo	CodeCode Available
Scaling shared model governance via model splitting	Dec 14, 2018	Deep Learningmodel	—Unverified
Guaranteed satisficing and finite regret: Analysis of a cognitive satisficing value function	Dec 14, 2018	reinforcement-learningReinforcement Learning	—Unverified
IRLAS: Inverse Reinforcement Learning for Architecture Search	Dec 13, 2018	Neural Architecture Searchreinforcement-learning	CodeCode Available
Learning to Communicate: A Machine Learning Framework for Heterogeneous Multi-Agent Robotic Systems	Dec 13, 2018	BIG-bench Machine Learningreinforcement-learning	—Unverified
Exploration Conscious Reinforcement Learning Revisited	Dec 13, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
A predictive safety filter for learning-based control of constrained nonlinear dynamical systems	Dec 13, 2018	Model Predictive ControlReinforcement Learning	—Unverified
Efficient Model-Free Reinforcement Learning Using Gaussian Process	Dec 11, 2018	modelreinforcement-learning	—Unverified
KF-LAX: Kronecker-factored curvature estimation for control variate optimization in reinforcement learning	Dec 11, 2018	Atari Gamesreinforcement-learning	—Unverified
Dialogue Generation: From Imitation Learning to Inverse Reinforcement Learning	Dec 9, 2018	Dialogue GenerationImitation Learning	CodeCode Available
The Gap Between Model-Based and Model-Free Methods on the Linear Quadratic Regulator: An Asymptotic Viewpoint	Dec 9, 2018	continuous-controlContinuous Control	—Unverified
Learning Montezuma's Revenge from a Single Demonstration	Dec 8, 2018	Montezuma's Revengereinforcement-learning	—Unverified
Communication-Efficient Policy Gradient Methods for Distributed Reinforcement Learning	Dec 7, 2018	Distributed ComputingMulti-agent Reinforcement Learning	—Unverified
Residual Reinforcement Learning for Robot Control	Dec 7, 2018	Frictionreinforcement-learning	—Unverified
Measuring and Characterizing Generalization in Deep Reinforcement Learning	Dec 7, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
ToyBox: Better Atari Environments for Testing Reinforcement Learning Agents	Dec 6, 2018	Atari Gamesreinforcement-learning	CodeCode Available
Pseudo-Rehearsal: Achieving Deep Reinforcement Learning without Catastrophic Forgetting	Dec 6, 2018	Atari GamesContinual Learning	CodeCode Available
Active Deep Q-learning with Demonstration	Dec 6, 2018	Q-Learningreinforcement-learning	—Unverified
Finite-Sample Analysis For Decentralized Batch Multi-Agent Reinforcement Learning With Networked Agents	Dec 6, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning and the Deadly Triad	Dec 6, 2018	Deep Reinforcement LearningLearning Theory	—Unverified
Adapting Auxiliary Losses Using Gradient Similarity	Dec 5, 2018	Atari Gamesreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 264 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified