Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14551–14600 of 15113 papers

Title	Date	Tasks	Status	Hype
Bridging the Gap Between Value and Policy Based Reinforcement Learning	Feb 28, 2017	Q-Learningreinforcement-learning	—Unverified	0
Stabilising Experience Replay for Deep Multi-Agent Reinforcement Learning	Feb 28, 2017	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	1
Neural Map: Structured Memory for Deep Reinforcement Learning	Feb 27, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
A Dataset for Developing and Benchmarking Active Vision	Feb 27, 2017	BenchmarkingGeneral Classification	—Unverified	0
Reinforcement Learning with Deep Energy-Based Policies	Feb 27, 2017	Q-Learningreinforcement-learning	CodeCode Available	0
Learning Control for Air Hockey Striking using Deep Reinforcement Learning	Feb 26, 2017	Deep Reinforcement LearningQ-Learning	—Unverified	0
Stochastic Variance Reduction Methods for Policy Evaluation	Feb 25, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Robot gains Social Intelligence through Multimodal Deep Reinforcement Learning	Feb 24, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Online Meta-learning by Parallel Algorithm Competition	Feb 24, 2017	Atari GamesDeep Reinforcement Learning	—Unverified	0
Changing Model Behavior at Test-Time Using Reinforcement Learning	Feb 24, 2017	BIG-bench Machine LearningMixture-of-Experts	—Unverified	0
Control of Gene Regulatory Networks with Noisy Measurements and Uncertain Inputs	Feb 24, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Automatic Representation for Lifetime Value Recommender Systems	Feb 23, 2017	Recommendation SystemsReinforcement Learning	—Unverified	0
Data Distillation for Controlling Specificity in Dialogue Generation	Feb 22, 2017	Dialogue Generationreinforcement-learning	—Unverified	0
Tackling Error Propagation through Reinforcement Learning: A Case of Greedy Dependency Parsing	Feb 22, 2017	Dependency Parsingreinforcement-learning	CodeCode Available	0
Real-time visual tracking by deep reinforced decision making	Feb 21, 2017	Deep Reinforcement LearningReal-Time Visual Tracking	CodeCode Available	0
Reinforcement Learning Based Argument Component Detection	Feb 21, 2017	General Classificationreinforcement-learning	—Unverified	0
Towards a Common Implementation of Reinforcement Learning for Multiple Robotic Tasks	Feb 21, 2017	Decision Makingreinforcement-learning	CodeCode Available	0
Active One-shot Learning	Feb 21, 2017	ClassificationGeneral Classification	CodeCode Available	0
Beating the World's Best at Super Smash Bros. with Deep Reinforcement Learning	Feb 21, 2017	Atari GamesBoard Games	CodeCode Available	0
Learning to Repeat: Fine Grained Action Repetition for Deep Reinforcement Learning	Feb 20, 2017	Car RacingDecision Making	—Unverified	0
Collaborative Deep Reinforcement Learning	Feb 19, 2017	Deep Reinforcement LearningKnowledge Distillation	CodeCode Available	0
Collaborative Deep Reinforcement Learning for Joint Object Search	Feb 18, 2017	Active Object LocalizationDeep Reinforcement Learning	—Unverified	0
Batch Policy Gradient Methods for Improving Neural Conversation Models	Feb 10, 2017	ChatbotPolicy Gradient Methods	—Unverified	0
Multi-agent Reinforcement Learning in Sequential Social Dilemmas	Feb 10, 2017	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Hybrid Code Networks: practical and efficient end-to-end dialog control with supervised and reinforcement learning	Feb 10, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Sigmoid-Weighted Linear Units for Neural Network Function Approximation in Reinforcement Learning	Feb 10, 2017	Atari GamesDeep Reinforcement Learning	—Unverified	0
Autonomous Braking System via Deep Reinforcement Learning	Feb 8, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Semi-Supervised QA with Generative Domain-Adaptive Nets	Feb 7, 2017	Domain AdaptationQuestion Answering	—Unverified	0
Uncertainty-Aware Reinforcement Learning for Collision Avoidance	Feb 3, 2017	Collision AvoidanceNavigate	—Unverified	0
Deep Reinforcement Learning for Robotic Manipulation-The state of the art	Jan 31, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Visual Object Tracking in Videos	Jan 31, 2017	Decision MakingDeep Reinforcement Learning	—Unverified	0
Expert Level control of Ramp Metering based on Multi-task Deep Reinforcement Learning	Jan 30, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
PathNet: Evolution Channels Gradient Descent in Super Neural Networks	Jan 30, 2017	Continual Learningreinforcement-learning	CodeCode Available	0
Flow Navigation by Smart Microswimmers via Reinforcement Learning	Jan 30, 2017	Navigatereinforcement-learning	—Unverified	0
Reinforcement Learning Algorithm Selection	Jan 30, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Light Transport the Reinforced Way	Jan 25, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Deep Reinforcement Learning: An Overview	Jan 25, 2017	Deep Reinforcement LearningMachine Translation	CodeCode Available	0
Artificial Intelligence Approaches To UCAV Autonomy	Jan 24, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Regularizing Neural Networks by Penalizing Confident Output Distributions	Jan 23, 2017	General Classificationimage-classification	CodeCode Available	0
Adversarial Learning for Neural Dialogue Generation	Jan 23, 2017	Dialogue EvaluationDialogue Generation	CodeCode Available	0
Binary Matrix Guessing Problem	Jan 22, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Basic protocols in quantum reinforcement learning with superconducting circuits	Jan 18, 2017	BIG-bench Machine LearningQuantum Machine Learning	—Unverified	0
Vulnerability of Deep Reinforcement Learning to Policy Induction Attacks	Jan 16, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Near Optimal Behavior via Approximate State Abstraction	Jan 15, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Agent-Agnostic Human-in-the-Loop Reinforcement Learning	Jan 15, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Scalable and Incremental Learning of Gaussian Mixture Models	Jan 14, 2017	General ClassificationIncremental Learning	—Unverified	0
Real-Time Bidding by Reinforcement Learning in Display Advertising	Jan 10, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Reinforcement Learning via Recurrent Convolutional Neural Networks	Jan 9, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Reinforcement Learning based Embodied Agents Modelling Human Users Through Interaction and Multi-Sensory Perception	Jan 9, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
A Review of Neural Network Based Machine Learning Approaches for Rotor Angle Stability Control	Jan 5, 2017	BIG-bench Machine Learningenergy management	—Unverified	0

Show:10 25 50

← PrevPage 292 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified