Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14651–14700 of 15113 papers

Title	Date	Tasks	Status
Towards deep learning with spiking neurons in energy based models with contrastive Hebbian plasticity	Dec 9, 2016	Deep LearningGeneral Classification	—Unverified
Stochastic Primal-Dual Methods and Sample Complexity of Reinforcement Learning	Dec 8, 2016	reinforcement-learningReinforcement Learning	—Unverified
Towards Information-Seeking Agents	Dec 8, 2016	reinforcement-learningReinforcement Learning	—Unverified
Hierarchy through Composition with Linearly Solvable Markov Decision Processes	Dec 8, 2016	reinforcement-learningReinforcement Learning	—Unverified
Learning to superoptimize programs - Workshop Version	Dec 4, 2016	reinforcement-learningReinforcement Learning	—Unverified
Deep Learning of Robotic Tasks without a Simulator using Strong and Weak Human Supervision	Dec 4, 2016	Imitation Learningreinforcement-learning	—Unverified
Bayesian Optimization with Robust Bayesian Neural Networks	Dec 1, 2016	Bayesian OptimizationDeep Reinforcement Learning	CodeCode Available
Bootstrapping incremental dialogue systems: using linguistic knowledge to learn from minimal data	Dec 1, 2016	Dialogue ManagementManagement	—Unverified
Generalizing Skills with Semi-Supervised Reinforcement Learning	Dec 1, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive optimal training of animal behavior	Dec 1, 2016	Experimental Designreinforcement-learning	—Unverified
Linear Feature Encoding for Reinforcement Learning	Dec 1, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Playing Doom with SLAM-Augmented Deep Reinforcement Learning	Dec 1, 2016	Deep Reinforcement Learningobject-detection	CodeCode Available
Showing versus doing: Teaching by demonstration	Dec 1, 2016	reinforcement-learningReinforcement Learning	—Unverified
Exploration for Multi-task Reinforcement Learning with Deep Generative Models	Nov 29, 2016	reinforcement-learningReinforcement Learning	—Unverified
Learning to Compose Words into Sentences with Reinforcement Learning	Nov 28, 2016	reinforcement-learningReinforcement Learning	—Unverified
Improving Policy Gradient by Exploring Under-appreciated Rewards	Nov 28, 2016	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Nonparametric General Reinforcement Learning	Nov 28, 2016	General Reinforcement Learningreinforcement-learning	—Unverified
Training an Interactive Humanoid Robot Using Multimodal Deep Reinforcement Learning	Nov 26, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Deep Reinforcement Learning for Multi-Domain Dialogue Systems	Nov 26, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
A Simple, Fast Diverse Decoding Algorithm for Neural Generation	Nov 25, 2016	Abstractive Text SummarizationDiversity	CodeCode Available
Multiscale Inverse Reinforcement Learning using Diffusion Wavelets	Nov 24, 2016	reinforcement-learningReinforcement Learning	—Unverified
Recurrent Attention Models for Depth-Based Person Identification	Nov 22, 2016	Person Identificationreinforcement-learning	—Unverified
Variational Intrinsic Control	Nov 22, 2016	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Memory Lens: How Much Memory Does an Agent Use?	Nov 21, 2016	reinforcement-learningReinforcement Learning	—Unverified
Options Discovery with Budgeted Reinforcement Learning	Nov 21, 2016	reinforcement-learningReinforcement Learning	—Unverified
A Deep Learning Approach for Joint Video Frame and Reward Prediction in Atari Games	Nov 21, 2016	Atari GamesModel-based Reinforcement Learning	—Unverified
Reinforcement Learning through Asynchronous Advantage Actor-Critic on a GPU	Nov 18, 2016	CPUGPU	CodeCode Available
Learning to reinforcement learn	Nov 17, 2016	Deep Reinforcement LearningMeta-Learning	CodeCode Available
Reinforcement Learning with Unsupervised Auxiliary Tasks	Nov 16, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforcement Learning in Rich-Observation MDPs using Spectral Methods	Nov 11, 2016	reinforcement-learningReinforcement Learning	—Unverified
Hierarchical Object Detection with Deep Reinforcement Learning	Nov 11, 2016	Deep Reinforcement LearningObject	CodeCode Available
A Connection between Generative Adversarial Networks, Inverse Reinforcement Learning, and Energy-Based Models	Nov 11, 2016	Imitation Learningreinforcement-learning	CodeCode Available
Learning to Navigate in Complex Environments	Nov 11, 2016	Depth EstimationDepth Prediction	CodeCode Available
Fairness in Reinforcement Learning	Nov 9, 2016	Fairnessreinforcement-learning	—Unverified
Sequence Tutor: Conservative Fine-Tuning of Sequence Generation Models with KL-control	Nov 9, 2016	DiversityReinforcement Learning	—Unverified
RL^2: Fast Reinforcement Learning via Slow Reinforcement Learning	Nov 9, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforcement Learning Approach for Parallelization in Filters Aggregation Based Feature Selection Algorithms	Nov 7, 2016	BIG-bench Machine Learningfeature selection	—Unverified
Q-Prop: Sample-Efficient Policy Gradient with An Off-Policy Critic	Nov 7, 2016	continuous-controlContinuous Control	CodeCode Available
Designing Neural Network Architectures using Reinforcement Learning	Nov 7, 2016	General Classificationimage-classification	CodeCode Available
Averaged-DQN: Variance Reduction and Stabilization for Deep Reinforcement Learning	Nov 7, 2016	Atari GamesDeep Reinforcement Learning	—Unverified
Learning to Perform Physics Experiments via Deep Reinforcement Learning	Nov 6, 2016	Deep Reinforcement LearningFriction	—Unverified
Modular Multitask Reinforcement Learning with Policy Sketches	Nov 6, 2016	continuous-controlContinuous Control	CodeCode Available
Neural Architecture Search with Reinforcement Learning	Nov 5, 2016	Image ClassificationLanguage Modeling	CodeCode Available
Learning to Play in a Day: Faster Deep Reinforcement Learning by Optimality Tightening	Nov 5, 2016	Atari GamesDeep Reinforcement Learning	CodeCode Available
Multi-task learning with deep model based reinforcement learning	Nov 4, 2016	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified
Quantile Reinforcement Learning	Nov 3, 2016	reinforcement-learningReinforcement Learning	—Unverified
Using a Deep Reinforcement Learning Agent for Traffic Signal Control	Nov 3, 2016	Deep Reinforcement LearningQ-Learning	—Unverified
Learning Locomotion Skills Using DeepRL: Does the Choice of Action Space Matter?	Nov 3, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Combating Reinforcement Learning's Sisyphean Curse with Intrinsic Fear	Nov 3, 2016	Atari GamesDeep Reinforcement Learning	—Unverified
Learning Runtime Parameters in Computer Systems with Delayed Experience Injection	Oct 31, 2016	CPUDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 294 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified