Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14801–14850 of 15113 papers

Title	Date	Tasks	Status
Model-Free Imitation Learning with Policy Optimization	May 26, 2016	Imitation Learningmodel	—Unverified
A PAC RL Algorithm for Episodic POMDPs	May 25, 2016	reinforcement-learningReinforcement Learning	—Unverified
Learning and Policy Search in Stochastic Dynamical Systems with Bayesian Neural Networks	May 23, 2016	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Learning to Communicate with Deep Multi-Agent Reinforcement Learning	May 21, 2016	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available
Localizing by Describing: Attribute-Guided Attention Localization for Fine-Grained Recognition	May 20, 2016	Attributereinforcement-learning	—Unverified
Option Discovery in Hierarchical Reinforcement Learning using Spatio-Temporal Clustering	May 17, 2016	ClusteringHierarchical Reinforcement Learning	—Unverified
A Reinforcement Learning System to Encourage Physical Activity in Diabetes Patients	May 13, 2016	reinforcement-learningReinforcement Learning	—Unverified
Optimizing human-interpretable dialog management policy using Genetic Algorithm	May 12, 2016	Managementreinforcement-learning	—Unverified
Avoiding Wireheading with Value Reinforcement Learning	May 10, 2016	reinforcement-learningReinforcement Learning	—Unverified
ViZDoom: A Doom-based AI Research Platform for Visual Reinforcement Learning	May 6, 2016	Atari GamesFPS Games	CodeCode Available
Classifying Options for Deep Reinforcement Learning	Apr 27, 2016	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Tournament selection in zeroth-level classifier systems based on average reward reinforcement learning	Apr 26, 2016	reinforcement-learningReinforcement Learning	—Unverified
Using Reinforcement Learning to Validate Empirical Game-Theoretic Analysis: A Continuous Double Auction Study	Apr 22, 2016	reinforcement-learningReinforcement Learning	—Unverified
Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motivation	Apr 20, 2016	Deep Reinforcement LearningMontezuma's Revenge	CodeCode Available
Inverse Reinforcement Learning with Simultaneous Estimation of Rewards and Dynamics	Apr 13, 2016	reinforcement-learningReinforcement Learning	—Unverified
Theoretically-Grounded Policy Advice from Multiple Teachers in Reinforcement Learning Settings with Applications to Negative Transfer	Apr 13, 2016	reinforcement-learningReinforcement Learning	—Unverified
A statistical learning strategy for closed-loop control of fluid flows	Apr 11, 2016	reinforcement-learningReinforcement Learning	—Unverified
Data-Efficient Off-Policy Policy Evaluation for Reinforcement Learning	Apr 4, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement learning based local search for grouping problems: A case study on graph coloring	Apr 1, 2016	Combinatorial Optimizationreinforcement-learning	—Unverified
Algorithms for Batch Hierarchical Reinforcement Learning	Mar 29, 2016	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Negative Learning Rates and P-Learning	Mar 27, 2016	regressionreinforcement-learning	—Unverified
Improving Information Extraction by Acquiring External Evidence with Reinforcement Learning	Mar 25, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
Fully Convolutional Attention Networks for Fine-Grained Recognition	Mar 22, 2016	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Parameter Selection in Evolutionary Algorithms by Reinforcement Learning with Dynamic Discretization of Parameter Range	Mar 22, 2016	Evolutionary Algorithmsreinforcement-learning	—Unverified
Feature Selection as a Multiagent Coordination Problem	Mar 16, 2016	feature selectionreinforcement-learning	—Unverified
Exploratory Gradient Boosting for Reinforcement Learning in Complex Domains	Mar 14, 2016	Minecraftreinforcement-learning	CodeCode Available
A Signaling Game Approach to Databases Querying and Interaction	Mar 13, 2016	Data InteractionManagement	—Unverified
Hierarchical Linearly-Solvable Markov Decision Problems	Mar 10, 2016	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Differentially Private Policy Evaluation	Mar 7, 2016	reinforcement-learningReinforcement Learning	—Unverified
Learning Shared Representations in Multi-task Reinforcement Learning	Mar 7, 2016	reinforcement-learningReinforcement Learning	—Unverified
Hierarchical Decision Making In Electricity Grid Management	Mar 6, 2016	Decision MakingManagement	—Unverified
Reinforcement Learning of POMDPs using Spectral Methods	Feb 25, 2016	reinforcement-learningReinforcement Learning	—Unverified
Weight Normalization: A Simple Reparameterization to Accelerate Training of Deep Neural Networks	Feb 25, 2016	Deep Reinforcement LearningImage Classification	CodeCode Available
Thompson Sampling is Asymptotically Optimal in General Environments	Feb 25, 2016	reinforcement-learningReinforcement Learning	—Unverified
Meta-learning within Projective Simulation	Feb 25, 2016	Meta-Learningreinforcement-learning	—Unverified
Learning values across many orders of magnitude	Feb 24, 2016	Atari Gamesreinforcement-learning	—Unverified
Policy Error Bounds for Model-Based Reinforcement Learning with Factored Linear Models	Feb 19, 2016	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Inverse Reinforcement Learning in Swarm Systems	Feb 17, 2016	reinforcement-learningReinforcement Learning	—Unverified
POMDP-lite for Robust Robot Planning under Uncertainty	Feb 16, 2016	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Reinforcement Learning approach for Real Time Strategy Games Battle city and S3	Feb 16, 2016	Q-LearningReal-Time Strategy Games	—Unverified
Deep Exploration via Bootstrapped DQN	Feb 15, 2016	Atari GamesEfficient Exploration	CodeCode Available
Value Iteration Networks	Feb 9, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
PAC Reinforcement Learning with Rich Observations	Feb 8, 2016	Decision MakingMulti-Armed Bandits	—Unverified
Graying the black box: Understanding DQNs	Feb 8, 2016	reinforcement-learningReinforcement Learning	—Unverified
Data-Efficient Reinforcement Learning in Continuous-State POMDPs	Feb 8, 2016	reinforcement-learningReinforcement Learning	—Unverified
Learning to Communicate to Solve Riddles with Deep Distributed Recurrent Q-Networks	Feb 8, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Active Information Acquisition	Feb 5, 2016	General Reinforcement LearningReinforcement Learning	—Unverified
Quantum machine learning with glow for episodic tasks and decision games	Jan 27, 2016	BIG-bench Machine LearningQuantum Machine Learning	—Unverified
Towards Resolving Unidentifiability in Inverse Reinforcement Learning	Jan 25, 2016	reinforcement-learningReinforcement Learning	—Unverified
SimpleDS: A Simple Deep Reinforcement Learning Dialogue System	Jan 18, 2016	Deep Reinforcement LearningFeature Engineering	CodeCode Available

Show:10 25 50

← PrevPage 297 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified