Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14551–14600 of 15113 papers

Title	Date	Tasks	Status
Particle Value Functions	Mar 16, 2017	reinforcement-learningReinforcement Learning	—Unverified
Using Reinforcement Learning for Demand Response of Domestic Hot Water Buffers: a Real-Life Demonstration	Mar 16, 2017	Decision MakingModel-based Reinforcement Learning	—Unverified
Finite Sample Analysis of Two-Timescale Stochastic Approximation with Applications to Reinforcement Learning	Mar 15, 2017	reinforcement-learningReinforcement Learning	—Unverified
A Hierarchical Framework of Cloud Resource Allocation and Power Management Using Deep Reinforcement Learning	Mar 13, 2017	Cloud ComputingDecision Making	—Unverified
Reinforcement Learning for Transition-Based Mention Detection	Mar 13, 2017	reinforcement-learningReinforcement Learning	—Unverified
Sensor Fusion for Robot Control through Deep Reinforcement Learning	Mar 13, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Micro-Objective Learning : Accelerating Deep Reinforcement Learning through the Discovery of Continuous Subgoals	Mar 11, 2017	Atari GamesDeep Reinforcement Learning	—Unverified
Communications that Emerge through Reinforcement Learning Using a (Recurrent) Neural Network	Mar 10, 2017	reinforcement-learningReinforcement Learning	—Unverified
What can you do with a rock? Affordance extraction via word embeddings	Mar 9, 2017	Affordance DetectionReinforcement Learning	—Unverified
Sample Efficient Feature Selection for Factored MDPs	Mar 9, 2017	Allfeature selection	—Unverified
Tactics of Adversarial Attack on Deep Reinforcement Learning Agents	Mar 8, 2017	Adversarial AttackAtari Games	—Unverified
Tree-Structured Reinforcement Learning for Sequential Object Localization	Mar 8, 2017	DiversityObject	—Unverified
Learning Invariant Feature Spaces to Transfer Skills with Reinforcement Learning	Mar 8, 2017	reinforcement-learningReinforcement Learning	—Unverified
Deep Variation-structured Reinforcement Learning for Visual Relationship and Attribute Detection	Mar 8, 2017	Attributeimage-classification	CodeCode Available
Functions that Emerge through End-to-End Reinforcement Learning - The Direction for Artificial General Intelligence -	Mar 7, 2017	Color ConstancyGame of Go	—Unverified
Third-Person Imitation Learning	Mar 6, 2017	Imitation Learningreinforcement-learning	CodeCode Available
Surprise-Based Intrinsic Motivation for Deep Reinforcement Learning	Mar 6, 2017	continuous-controlContinuous Control	—Unverified
Neural Episodic Control	Mar 6, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Unsupervised Basis Function Adaptation for Reinforcement Learning	Mar 3, 2017	reinforcement-learningReinforcement Learning	—Unverified
Multi-step Reinforcement Learning: A Unifying Algorithm	Mar 3, 2017	Q-Learningreinforcement-learning	—Unverified
FeUdal Networks for Hierarchical Reinforcement Learning	Mar 3, 2017	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available
Generalised Discount Functions applied to a Monte-Carlo AImu Implementation	Mar 3, 2017	General Reinforcement Learningreinforcement-learning	CodeCode Available
Actor-Critic Reinforcement Learning with Simultaneous Human Control and Feedback	Mar 3, 2017	reinforcement-learningReinforcement Learning	—Unverified
EX2: Exploration with Exemplar Models for Deep Reinforcement Learning	Mar 3, 2017	Deep Reinforcement LearningDensity Estimation	CodeCode Available
Deeply AggreVaTeD: Differentiable Imitation Learning for Sequential Prediction	Mar 3, 2017	Decision MakingDependency Parsing	—Unverified
A Laplacian Framework for Option Discovery in Reinforcement Learning	Mar 2, 2017	Atari Gamesreinforcement-learning	CodeCode Available
Learning to Optimize Neural Nets	Mar 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Pivoting Task	Mar 1, 2017	continuous-controlContinuous Control	CodeCode Available
Show, Attend and Interact: Perceivable Human-Robot Social Interaction through Neural Attention Q-Network	Feb 28, 2017	Deep Attentionreinforcement-learning	—Unverified
Bridging the Gap Between Value and Policy Based Reinforcement Learning	Feb 28, 2017	Q-Learningreinforcement-learning	—Unverified
Analysis of Agent Expertise in Ms. Pac-Man using Value-of-Information-based Policies	Feb 28, 2017	reinforcement-learningReinforcement Learning	—Unverified
Analysing Congestion Problems in Multi-agent Reinforcement Learning	Feb 28, 2017	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
A Dataset for Developing and Benchmarking Active Vision	Feb 27, 2017	BenchmarkingGeneral Classification	—Unverified
Neural Map: Structured Memory for Deep Reinforcement Learning	Feb 27, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforcement Learning with Deep Energy-Based Policies	Feb 27, 2017	Q-Learningreinforcement-learning	CodeCode Available
Learning Control for Air Hockey Striking using Deep Reinforcement Learning	Feb 26, 2017	Deep Reinforcement LearningQ-Learning	—Unverified
Stochastic Variance Reduction Methods for Policy Evaluation	Feb 25, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Robot gains Social Intelligence through Multimodal Deep Reinforcement Learning	Feb 24, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Online Meta-learning by Parallel Algorithm Competition	Feb 24, 2017	Atari GamesDeep Reinforcement Learning	—Unverified
Control of Gene Regulatory Networks with Noisy Measurements and Uncertain Inputs	Feb 24, 2017	reinforcement-learningReinforcement Learning	—Unverified
Changing Model Behavior at Test-Time Using Reinforcement Learning	Feb 24, 2017	BIG-bench Machine LearningMixture-of-Experts	—Unverified
Automatic Representation for Lifetime Value Recommender Systems	Feb 23, 2017	Recommendation SystemsReinforcement Learning	—Unverified
Data Distillation for Controlling Specificity in Dialogue Generation	Feb 22, 2017	Dialogue Generationreinforcement-learning	—Unverified
Tackling Error Propagation through Reinforcement Learning: A Case of Greedy Dependency Parsing	Feb 22, 2017	Dependency Parsingreinforcement-learning	CodeCode Available
Real-time visual tracking by deep reinforced decision making	Feb 21, 2017	Deep Reinforcement LearningReal-Time Visual Tracking	CodeCode Available
Towards a Common Implementation of Reinforcement Learning for Multiple Robotic Tasks	Feb 21, 2017	Decision Makingreinforcement-learning	CodeCode Available
Reinforcement Learning Based Argument Component Detection	Feb 21, 2017	General Classificationreinforcement-learning	—Unverified
Beating the World's Best at Super Smash Bros. with Deep Reinforcement Learning	Feb 21, 2017	Atari GamesBoard Games	CodeCode Available
Active One-shot Learning	Feb 21, 2017	ClassificationGeneral Classification	CodeCode Available
Learning to Repeat: Fine Grained Action Repetition for Deep Reinforcement Learning	Feb 20, 2017	Car RacingDecision Making	—Unverified

Show:10 25 50

← PrevPage 292 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified