Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14701–14750 of 15113 papers

Title	Date	Tasks	Status
Deep Reinforcement Learning for Robotic Manipulation with Asynchronous Off-Policy Updates	Oct 3, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Visual Foresight for Planning Robot Motion	Oct 3, 2016	Model-based Reinforcement LearningModel Predictive Control	CodeCode Available
Deep Reinforcement Learning for Tensegrity Robot Locomotion	Sep 28, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Mention-Ranking Coreference Models	Sep 27, 2016	coreference-resolutionCoreference Resolution	CodeCode Available
UbuntuWorld 1.0 LTS - A Platform for Automated Problem Solving & Troubleshooting in the Ubuntu OS	Sep 27, 2016	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Regulating Reward Training by Means of Certainty Prediction in a Neural Network-Implemented Pong Game	Sep 23, 2016	reinforcement-learningReinforcement Learning	—Unverified
Learning Modular Neural Network Policies for Multi-Task and Multi-Robot Transfer	Sep 22, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Input Convex Neural Networks	Sep 22, 2016	ImputationInference Optimization	CodeCode Available
Modelling Stock-market Investors as Reinforcement Learning Agents [Correction]	Sep 20, 2016	Decision MakingQ-Learning	—Unverified
Opponent Modeling in Deep Reinforcement Learning	Sep 18, 2016	Deep Reinforcement LearningMixture-of-Experts	CodeCode Available
Towards Deep Symbolic Reinforcement Learning	Sep 18, 2016	Deep Reinforcement LearningGame of Go	—Unverified
SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient	Sep 18, 2016	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Playing FPS Games with Deep Reinforcement Learning	Sep 18, 2016	Deep Reinforcement LearningFPS Games	CodeCode Available
Target-driven Visual Navigation in Indoor Scenes using Deep Reinforcement Learning	Sep 16, 2016	3D ReconstructionDeep Reinforcement Learning	CodeCode Available
Interactive Spoken Content Retrieval by Deep Reinforcement Learning	Sep 16, 2016	Deep Reinforcement LearningQ-Learning	—Unverified
Exploration Potential	Sep 16, 2016	Multi-Armed Banditsreinforcement-learning	—Unverified
The Option-Critic Architecture	Sep 16, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
Stochastic evolution in populations of ideas	Sep 14, 2016	reinforcement-learningReinforcement Learning (RL)	—Unverified
Bayesian Reinforcement Learning: A Survey	Sep 14, 2016	Bayesian Inferencereinforcement-learning	—Unverified
A Threshold-based Scheme for Reinforcement Learning in Neural Networks	Sep 12, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
A centralized reinforcement learning method for multi-agent job scheduling in Grid	Sep 11, 2016	reinforcement-learningReinforcement Learning	—Unverified
Episodic Exploration for Deep Deterministic Policies: An Application to StarCraft Micromanagement Tasks	Sep 10, 2016	Q-Learningreinforcement-learning	—Unverified
Dialogue manager domain adaptation using Gaussian process reinforcement learning	Sep 9, 2016	Domain AdaptationGaussian Processes	—Unverified
Unifying task specification in reinforcement learning	Sep 7, 2016	reinforcement-learningReinforcement Learning	—Unverified
Towards End-to-End Reinforcement Learning of Dialogue Agents for Information Access	Sep 3, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
Reward Function and Initial Values: Better Choices for Accelerated Goal-Directed Reinforcement Learning	Sep 1, 2016	reinforcement-learningReinforcement Learning (RL)	—Unverified
Single photon in hierarchical architecture for physical reinforcement learning: Photon intelligence	Sep 1, 2016	Decision Makingreinforcement-learning	—Unverified
Adaptive Probabilistic Trajectory Optimization via Efficient Approximate Inference	Aug 22, 2016	Model Predictive ControlReinforcement Learning	—Unverified
Modeling Human Reading with Neural Attention	Aug 19, 2016	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning algorithms for regret minimization in structured Markov Decision Processes	Aug 17, 2016	reinforcement-learningReinforcement Learning	—Unverified
Open Problem: Approximate Planning of POMDPs in the class of Memoryless Policies	Aug 17, 2016	Decision MakingReinforcement Learning	—Unverified
BBQ-Networks: Efficient Exploration in Deep Reinforcement Learning for Task-Oriented Dialogue Systems	Aug 17, 2016	Deep Reinforcement LearningEfficient Exploration	—Unverified
Perceptual Reward Functions	Aug 12, 2016	reinforcement-learningReinforcement Learning	—Unverified
Posterior Sampling for Reinforcement Learning Without Episodes	Aug 9, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
On Lower Bounds for Regret in Reinforcement Learning	Aug 9, 2016	reinforcement-learningReinforcement Learning	—Unverified
Neuroevolution-Based Inverse Reinforcement Learning	Aug 9, 2016	reinforcement-learningReinforcement Learning	—Unverified
Online Adaptation of Deep Architectures with Reinforcement Learning	Aug 8, 2016	Denoisingreinforcement-learning	—Unverified
Discovering Latent States for Model Learning: Applying Sensorimotor Contingencies Theory and Predictive Processing to Model Context	Aug 1, 2016	modelreinforcement-learning	—Unverified
Self-organization in a distributed coordination game through heuristic rules	Jul 31, 2016	AttributeReinforcement Learning (RL)	—Unverified
A Sensorimotor Reinforcement Learning Framework for Physical Human-Robot Interaction	Jul 27, 2016	Bayesian OptimizationGaussian Processes	—Unverified
Accelerating Stochastic Composition Optimization	Jul 25, 2016	reinforcement-learningReinforcement Learning	—Unverified
An Actor-Critic Algorithm for Sequence Prediction	Jul 24, 2016	Caption GenerationMachine Translation	CodeCode Available
Playing Atari Games with Deep Reinforcement Learning and Human Checkpoint Replay	Jul 18, 2016	Atari GamesDeep Reinforcement Learning	CodeCode Available
Sequential Cost-Sensitive Feature Acquisition	Jul 13, 2016	reinforcement-learningReinforcement Learning	—Unverified
Automatic Bridge Bidding Using Deep Reinforcement Learning	Jul 12, 2016	Decision MakingDeep Reinforcement Learning	—Unverified
A Greedy Approach to Adapting the Trace Parameter for Temporal Difference Learning	Jul 2, 2016	Meta-Learningreinforcement-learning	CodeCode Available
Why is Posterior Sampling Better than Optimism for Reinforcement Learning?	Jul 1, 2016	reinforcement-learningReinforcement Learning	—Unverified
Is the Bellman residual a bad proxy?	Jun 24, 2016	reinforcement-learningReinforcement Learning	—Unverified
Unsupervised preprocessing for Tactile Data	Jun 23, 2016	reinforcement-learningReinforcement Learning	—Unverified
Simultaneous Control and Human Feedback in the Training of a Robotic Agent with Actor-Critic Reinforcement Learning	Jun 22, 2016	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 295 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified