Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14651–14700 of 15113 papers

Title	Date	Tasks	Status	Hype
Memory Lens: How Much Memory Does an Agent Use?	Nov 21, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Options Discovery with Budgeted Reinforcement Learning	Nov 21, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
A Deep Learning Approach for Joint Video Frame and Reward Prediction in Atari Games	Nov 21, 2016	Atari GamesModel-based Reinforcement Learning	—Unverified	0
Reinforcement Learning through Asynchronous Advantage Actor-Critic on a GPU	Nov 18, 2016	CPUGPU	CodeCode Available	0
Learning to reinforcement learn	Nov 17, 2016	Deep Reinforcement LearningMeta-Learning	CodeCode Available	0
Reinforcement Learning with Unsupervised Auxiliary Tasks	Nov 16, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
#Exploration: A Study of Count-Based Exploration for Deep Reinforcement Learning	Nov 15, 2016	Atari Gamescontinuous-control	CodeCode Available	1
A Connection between Generative Adversarial Networks, Inverse Reinforcement Learning, and Energy-Based Models	Nov 11, 2016	Imitation Learningreinforcement-learning	CodeCode Available	0
Hierarchical Object Detection with Deep Reinforcement Learning	Nov 11, 2016	Deep Reinforcement LearningObject	CodeCode Available	0
Learning to Navigate in Complex Environments	Nov 11, 2016	Depth EstimationDepth Prediction	CodeCode Available	0
Reinforcement Learning in Rich-Observation MDPs using Spectral Methods	Nov 11, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
RL^2: Fast Reinforcement Learning via Slow Reinforcement Learning	Nov 9, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Fairness in Reinforcement Learning	Nov 9, 2016	Fairnessreinforcement-learning	—Unverified	0
Sequence Tutor: Conservative Fine-Tuning of Sequence Generation Models with KL-control	Nov 9, 2016	DiversityReinforcement Learning	—Unverified	0
Reinforcement Learning Approach for Parallelization in Filters Aggregation Based Feature Selection Algorithms	Nov 7, 2016	BIG-bench Machine Learningfeature selection	—Unverified	0
Q-Prop: Sample-Efficient Policy Gradient with An Off-Policy Critic	Nov 7, 2016	continuous-controlContinuous Control	CodeCode Available	0
Averaged-DQN: Variance Reduction and Stabilization for Deep Reinforcement Learning	Nov 7, 2016	Atari GamesDeep Reinforcement Learning	—Unverified	0
Designing Neural Network Architectures using Reinforcement Learning	Nov 7, 2016	General Classificationimage-classification	CodeCode Available	0
Modular Multitask Reinforcement Learning with Policy Sketches	Nov 6, 2016	continuous-controlContinuous Control	CodeCode Available	0
Learning to Perform Physics Experiments via Deep Reinforcement Learning	Nov 6, 2016	Deep Reinforcement LearningFriction	—Unverified	0
Learning to Play in a Day: Faster Deep Reinforcement Learning by Optimality Tightening	Nov 5, 2016	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Neural Architecture Search with Reinforcement Learning	Nov 5, 2016	Image ClassificationLanguage Modeling	CodeCode Available	0
Multi-task learning with deep model based reinforcement learning	Nov 4, 2016	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified	0
Using a Deep Reinforcement Learning Agent for Traffic Signal Control	Nov 3, 2016	Deep Reinforcement LearningQ-Learning	—Unverified	0
Quantile Reinforcement Learning	Nov 3, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Locomotion Skills Using DeepRL: Does the Choice of Action Space Matter?	Nov 3, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Sample Efficient Actor-Critic with Experience Replay	Nov 3, 2016	continuous-controlContinuous Control	CodeCode Available	1
Combating Reinforcement Learning's Sisyphean Curse with Intrinsic Fear	Nov 3, 2016	Atari GamesDeep Reinforcement Learning	—Unverified	0
Learning Runtime Parameters in Computer Systems with Delayed Experience Injection	Oct 31, 2016	CPUDeep Reinforcement Learning	—Unverified	0
Contextual Decision Processes with Low Bellman Rank are PAC-Learnable	Oct 29, 2016	Efficient Explorationreinforcement-learning	—Unverified	0
Quantum-enhanced machine learning	Oct 26, 2016	BIG-bench Machine LearningQuantum Machine Learning	—Unverified	0
Reinforcement Learning in Conflicting Environments for Autonomous Vehicles	Oct 22, 2016	Autonomous Vehiclesreinforcement-learning	—Unverified	0
Utilization of Deep Reinforcement Learning for saccadic-based object visual search	Oct 20, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Reinforcement Learning Approach to the View Planning Problem	Oct 19, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Particle Swarm Optimization for Generating Interpretable Fuzzy Reinforcement Learning Policies	Oct 19, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Online Contrastive Divergence with Generative Replay: Experience Replay without Storing Data	Oct 18, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
The End of Optimism? An Asymptotic Analysis of Finite-Armed Linear Bandits	Oct 14, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Reset-free Trial-and-Error Learning for Robot Damage Recovery	Oct 13, 2016	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Sim-to-Real Robot Learning from Pixels with Progressive Nets	Oct 13, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Introduction to the "Industrial Benchmark"	Oct 12, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Safe, Multi-Agent, Reinforcement Learning for Autonomous Driving	Oct 11, 2016	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Navigational Instruction Generation as Inverse Reinforcement Learning with Neural Machine Translation	Oct 11, 2016	Machine TranslationNavigate	—Unverified	0
Personalizing a Dialogue System with Transfer Reinforcement Learning	Oct 10, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Multi-Objective Deep Reinforcement Learning	Oct 9, 2016	Deep Reinforcement LearningMulti-Objective Reinforcement Learning	CodeCode Available	0
Deep Reinforcement Learning From Raw Pixels in Doom	Oct 7, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Active exploration in parameterized reinforcement learning	Oct 6, 2016	Meta-LearningQ-Learning	CodeCode Available	0
Towards Cognitive Exploration through Deep Reinforcement Learning for Mobile Robots	Oct 6, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Connecting Generative Adversarial Networks and Actor-Critic Methods	Oct 6, 2016	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Reset-Free Guided Policy Search: Efficient Deep Reinforcement Learning with Stochastic Initial States	Oct 4, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Collective Robot Reinforcement Learning with Distributed Asynchronous Guided Policy Search	Oct 3, 2016	Diversityreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 294 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified