Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14801–14850 of 15113 papers

Title	Date	Tasks	Status	Hype
Data-Efficient Off-Policy Policy Evaluation for Reinforcement Learning	Apr 4, 2016	reinforcement-learningReinforcement Learning	CodeCode Available	0
Reinforcement learning based local search for grouping problems: A case study on graph coloring	Apr 1, 2016	Combinatorial Optimizationreinforcement-learning	—Unverified	0
Algorithms for Batch Hierarchical Reinforcement Learning	Mar 29, 2016	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Negative Learning Rates and P-Learning	Mar 27, 2016	regressionreinforcement-learning	—Unverified	0
Improving Information Extraction by Acquiring External Evidence with Reinforcement Learning	Mar 25, 2016	reinforcement-learningReinforcement Learning	CodeCode Available	0
Adaptive Parameter Selection in Evolutionary Algorithms by Reinforcement Learning with Dynamic Discretization of Parameter Range	Mar 22, 2016	Evolutionary Algorithmsreinforcement-learning	—Unverified	0
Fully Convolutional Attention Networks for Fine-Grained Recognition	Mar 22, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Feature Selection as a Multiagent Coordination Problem	Mar 16, 2016	feature selectionreinforcement-learning	—Unverified	0
Exploratory Gradient Boosting for Reinforcement Learning in Complex Domains	Mar 14, 2016	Minecraftreinforcement-learning	CodeCode Available	0
A Signaling Game Approach to Databases Querying and Interaction	Mar 13, 2016	Data InteractionManagement	—Unverified	0
Hierarchical Linearly-Solvable Markov Decision Problems	Mar 10, 2016	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Learning Shared Representations in Multi-task Reinforcement Learning	Mar 7, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Differentially Private Policy Evaluation	Mar 7, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Hierarchical Decision Making In Electricity Grid Management	Mar 6, 2016	Decision MakingManagement	—Unverified	0
Deep Reinforcement Learning from Self-Play in Imperfect-Information Games	Mar 3, 2016	Card GamesDeep Reinforcement Learning	CodeCode Available	1
Continuous Deep Q-Learning with Model-based Acceleration	Mar 2, 2016	continuous-controlContinuous Control	CodeCode Available	1
Investigating practical linear temporal difference learning	Feb 28, 2016	reinforcement-learningReinforcement Learning	CodeCode Available	1
Meta-learning within Projective Simulation	Feb 25, 2016	Meta-Learningreinforcement-learning	—Unverified	0
Reinforcement Learning of POMDPs using Spectral Methods	Feb 25, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Thompson Sampling is Asymptotically Optimal in General Environments	Feb 25, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Weight Normalization: A Simple Reparameterization to Accelerate Training of Deep Neural Networks	Feb 25, 2016	Deep Reinforcement LearningImage Classification	CodeCode Available	0
Learning values across many orders of magnitude	Feb 24, 2016	Atari Gamesreinforcement-learning	—Unverified	0
Policy Error Bounds for Model-Based Reinforcement Learning with Factored Linear Models	Feb 19, 2016	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Inverse Reinforcement Learning in Swarm Systems	Feb 17, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning approach for Real Time Strategy Games Battle city and S3	Feb 16, 2016	Q-LearningReal-Time Strategy Games	—Unverified	0
POMDP-lite for Robust Robot Planning under Uncertainty	Feb 16, 2016	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Deep Exploration via Bootstrapped DQN	Feb 15, 2016	Atari GamesEfficient Exploration	CodeCode Available	0
Value Iteration Networks	Feb 9, 2016	reinforcement-learningReinforcement Learning	CodeCode Available	0
Learning to Communicate to Solve Riddles with Deep Distributed Recurrent Q-Networks	Feb 8, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Data-Efficient Reinforcement Learning in Continuous-State POMDPs	Feb 8, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
PAC Reinforcement Learning with Rich Observations	Feb 8, 2016	Decision MakingMulti-Armed Bandits	—Unverified	0
Graying the black box: Understanding DQNs	Feb 8, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
Active Information Acquisition	Feb 5, 2016	General Reinforcement LearningReinforcement Learning	—Unverified	0
Asynchronous Methods for Deep Reinforcement Learning	Feb 4, 2016	Atari GamesCPU	CodeCode Available	1
Quantum machine learning with glow for episodic tasks and decision games	Jan 27, 2016	BIG-bench Machine LearningQuantum Machine Learning	—Unverified	0
Towards Resolving Unidentifiability in Inverse Reinforcement Learning	Jan 25, 2016	reinforcement-learningReinforcement Learning	—Unverified	0
SimpleDS: A Simple Deep Reinforcement Learning Dialogue System	Jan 18, 2016	Deep Reinforcement LearningFeature Engineering	CodeCode Available	0
Learning to Compose Neural Networks for Question Answering	Jan 7, 2016	Question Answeringreinforcement-learning	CodeCode Available	0
Angrier Birds: Bayesian reinforcement learning	Jan 6, 2016	Efficient ExplorationQ-Learning	CodeCode Available	0
Taming the Noise in Reinforcement Learning via Soft Updates	Dec 28, 2015	Q-Learningreinforcement-learning	CodeCode Available	0
Inverse Reinforcement Learning via Deep Gaussian Process	Dec 26, 2015	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning in Large Discrete Action Spaces	Dec 24, 2015	Deep Reinforcement LearningRecommendation Systems	CodeCode Available	0
An Empirical Comparison of Neural Architectures for Reinforcement Learning in Partially Observable Environments	Dec 17, 2015	CPUreinforcement-learning	—Unverified	0
Increasing the Action Gap: New Operators for Reinforcement Learning	Dec 15, 2015	Atari GamesQ-Learning	CodeCode Available	0
How to Discount Deep Reinforcement Learning: Towards New Dynamic Strategies	Dec 7, 2015	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Attention Recurrent Q-Network	Dec 5, 2015	Atari GamesDeep Attention	CodeCode Available	0
Risk-Constrained Reinforcement Learning with Percentile Risk Criteria	Dec 5, 2015	Decision MakingMarketing	—Unverified	0
Q-Networks for Binary Vector Actions	Dec 4, 2015	Q-Learningreinforcement-learning	—Unverified	0
State of the Art Control of Atari Games Using Shallow Reinforcement Learning	Dec 4, 2015	Atari Gamesreinforcement-learning	CodeCode Available	0
Multi-Class Multi-Annotator Active Learning With Robust Gaussian Process for Visual Recognition	Dec 1, 2015	Active LearningBayesian Inference	—Unverified	0

Show:10 25 50

← PrevPage 297 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified