Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14601–14650 of 15113 papers

Title	Date	Tasks	Status
Collaborative Deep Reinforcement Learning	Feb 19, 2017	Deep Reinforcement LearningKnowledge Distillation	CodeCode Available
Collaborative Deep Reinforcement Learning for Joint Object Search	Feb 18, 2017	Active Object LocalizationDeep Reinforcement Learning	—Unverified
Batch Policy Gradient Methods for Improving Neural Conversation Models	Feb 10, 2017	ChatbotPolicy Gradient Methods	—Unverified
Hybrid Code Networks: practical and efficient end-to-end dialog control with supervised and reinforcement learning	Feb 10, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Sigmoid-Weighted Linear Units for Neural Network Function Approximation in Reinforcement Learning	Feb 10, 2017	Atari GamesDeep Reinforcement Learning	—Unverified
Autonomous Braking System via Deep Reinforcement Learning	Feb 8, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Semi-Supervised QA with Generative Domain-Adaptive Nets	Feb 7, 2017	Domain AdaptationQuestion Answering	—Unverified
Uncertainty-Aware Reinforcement Learning for Collision Avoidance	Feb 3, 2017	Collision AvoidanceNavigate	—Unverified
Deep Reinforcement Learning for Robotic Manipulation-The state of the art	Jan 31, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Visual Object Tracking in Videos	Jan 31, 2017	Decision MakingDeep Reinforcement Learning	—Unverified
Flow Navigation by Smart Microswimmers via Reinforcement Learning	Jan 30, 2017	Navigatereinforcement-learning	—Unverified
Expert Level control of Ramp Metering based on Multi-task Deep Reinforcement Learning	Jan 30, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning Algorithm Selection	Jan 30, 2017	reinforcement-learningReinforcement Learning	—Unverified
PathNet: Evolution Channels Gradient Descent in Super Neural Networks	Jan 30, 2017	Continual Learningreinforcement-learning	CodeCode Available
Learning Light Transport the Reinforced Way	Jan 25, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning: An Overview	Jan 25, 2017	Deep Reinforcement LearningMachine Translation	CodeCode Available
Artificial Intelligence Approaches To UCAV Autonomy	Jan 24, 2017	reinforcement-learningReinforcement Learning	—Unverified
Adversarial Learning for Neural Dialogue Generation	Jan 23, 2017	Dialogue EvaluationDialogue Generation	CodeCode Available
Regularizing Neural Networks by Penalizing Confident Output Distributions	Jan 23, 2017	General Classificationimage-classification	CodeCode Available
Binary Matrix Guessing Problem	Jan 22, 2017	reinforcement-learningReinforcement Learning	—Unverified
Basic protocols in quantum reinforcement learning with superconducting circuits	Jan 18, 2017	BIG-bench Machine LearningQuantum Machine Learning	—Unverified
Vulnerability of Deep Reinforcement Learning to Policy Induction Attacks	Jan 16, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Near Optimal Behavior via Approximate State Abstraction	Jan 15, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Agent-Agnostic Human-in-the-Loop Reinforcement Learning	Jan 15, 2017	reinforcement-learningReinforcement Learning	—Unverified
Scalable and Incremental Learning of Gaussian Mixture Models	Jan 14, 2017	General ClassificationIncremental Learning	—Unverified
Real-Time Bidding by Reinforcement Learning in Display Advertising	Jan 10, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning based Embodied Agents Modelling Human Users Through Interaction and Multi-Sensory Perception	Jan 9, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Reinforcement Learning via Recurrent Convolutional Neural Networks	Jan 9, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Toward negotiable reinforcement learning: shifting priorities in Pareto optimal sequential decision-making	Jan 5, 2017	Decision MakingMulti-Objective Reinforcement Learning	—Unverified
A Review of Neural Network Based Machine Learning Approaches for Rotor Angle Stability Control	Jan 5, 2017	BIG-bench Machine Learningenergy management	—Unverified
First-Person Activity Forecasting with Online Inverse Reinforcement Learning	Dec 22, 2016	reinforcement-learningReinforcement Learning	—Unverified
On the function approximation error for risk-sensitive reinforcement learning	Dec 22, 2016	reinforcement-learningReinforcement Learning	—Unverified
Non-Deterministic Policy Improvement Stabilizes Approximated Reinforcement Learning	Dec 22, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Survey of Deep Network Solutions for Learning Control in Robotics: From Reinforcement to Imitation	Dec 21, 2016	Deep Reinforcement LearningImitation Learning	CodeCode Available
Loss is its own Reward: Self-Supervision for Reinforcement Learning	Dec 21, 2016	reinforcement-learningReinforcement Learning	—Unverified
Unsupervised Perceptual Rewards for Imitation Learning	Dec 20, 2016	Imitation LearningReinforcement Learning	—Unverified
Self-Correcting Models for Model-Based Reinforcement Learning	Dec 19, 2016	modelModel-based Reinforcement Learning	CodeCode Available
Sample-efficient Deep Reinforcement Learning for Dialog Control	Dec 18, 2016	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Reinforcement Learning Using Quantum Boltzmann Machines	Dec 17, 2016	reinforcement-learningReinforcement Learning	—Unverified
A User Simulator for Task-Completion Dialogues	Dec 17, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
Learning to predict where to look in interactive environments using deep recurrent q-learning	Dec 17, 2016	Atari GamesQ-Learning	—Unverified
Deep Reinforcement Learning with Successor Features for Navigation across Similar Environments	Dec 16, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Separation of Concerns in Reinforcement Learning	Dec 15, 2016	reinforcement-learningReinforcement Learning	—Unverified
Response to Comment on 'Perceptual Learning Incepted by Decoded fMRI Neurofeedback Without Stimulus Presentation'; How can a decoded neurofeedback method (DecNef) lead to successful reinforcement and visual perceptual learning?	Dec 13, 2016	Reinforcement Learning (RL)	—Unverified
Incorporating Human Domain Knowledge into Large Scale Cost Function Learning	Dec 13, 2016	Motion Planningreinforcement-learning	—Unverified
End-to-End Deep Reinforcement Learning for Lane Keeping Assist	Dec 13, 2016	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Learning to Drive using Inverse Reinforcement Learning and Deep Q-Networks	Dec 12, 2016	Autonomous Drivingreinforcement-learning	—Unverified
Online Reinforcement Learning for Real-Time Exploration in Continuous State and Action Markov Decision Processes	Dec 12, 2016	regressionReinforcement Learning	—Unverified
PoseAgent: Budget-Constrained 6D Object Pose Estimation via Reinforcement Learning	Dec 12, 2016	6D Pose Estimation using RGBPose Estimation	—Unverified
Reinforcement Learning With Temporal Logic Rewards	Dec 11, 2016	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 293 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified