Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14701–14750 of 15113 papers

Title	Date	Tasks	Status
Contextual Decision Processes with Low Bellman Rank are PAC-Learnable	Oct 29, 2016	Efficient Explorationreinforcement-learning	—Unverified
Quantum-enhanced machine learning	Oct 26, 2016	BIG-bench Machine LearningQuantum Machine Learning	—Unverified
Reinforcement Learning in Conflicting Environments for Autonomous Vehicles	Oct 22, 2016	Autonomous Vehiclesreinforcement-learning	—Unverified
Utilization of Deep Reinforcement Learning for saccadic-based object visual search	Oct 20, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Particle Swarm Optimization for Generating Interpretable Fuzzy Reinforcement Learning Policies	Oct 19, 2016	reinforcement-learningReinforcement Learning	—Unverified
A Reinforcement Learning Approach to the View Planning Problem	Oct 19, 2016	reinforcement-learningReinforcement Learning	—Unverified
Online Contrastive Divergence with Generative Replay: Experience Replay without Storing Data	Oct 18, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
The End of Optimism? An Asymptotic Analysis of Finite-Armed Linear Bandits	Oct 14, 2016	reinforcement-learningReinforcement Learning	—Unverified
Sim-to-Real Robot Learning from Pixels with Progressive Nets	Oct 13, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reset-free Trial-and-Error Learning for Robot Damage Recovery	Oct 13, 2016	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Introduction to the "Industrial Benchmark"	Oct 12, 2016	reinforcement-learningReinforcement Learning	—Unverified
Safe, Multi-Agent, Reinforcement Learning for Autonomous Driving	Oct 11, 2016	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Navigational Instruction Generation as Inverse Reinforcement Learning with Neural Machine Translation	Oct 11, 2016	Machine TranslationNavigate	—Unverified
Personalizing a Dialogue System with Transfer Reinforcement Learning	Oct 10, 2016	reinforcement-learningReinforcement Learning	—Unverified
Multi-Objective Deep Reinforcement Learning	Oct 9, 2016	Deep Reinforcement LearningMulti-Objective Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning From Raw Pixels in Doom	Oct 7, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Active exploration in parameterized reinforcement learning	Oct 6, 2016	Meta-LearningQ-Learning	CodeCode Available
Connecting Generative Adversarial Networks and Actor-Critic Methods	Oct 6, 2016	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Towards Cognitive Exploration through Deep Reinforcement Learning for Mobile Robots	Oct 6, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reset-Free Guided Policy Search: Efficient Deep Reinforcement Learning with Stochastic Initial States	Oct 4, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Robotic Manipulation with Asynchronous Off-Policy Updates	Oct 3, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Visual Foresight for Planning Robot Motion	Oct 3, 2016	Model-based Reinforcement LearningModel Predictive Control	CodeCode Available
Collective Robot Reinforcement Learning with Distributed Asynchronous Guided Policy Search	Oct 3, 2016	Diversityreinforcement-learning	—Unverified
Deep Reinforcement Learning for Tensegrity Robot Locomotion	Sep 28, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Mention-Ranking Coreference Models	Sep 27, 2016	coreference-resolutionCoreference Resolution	CodeCode Available
UbuntuWorld 1.0 LTS - A Platform for Automated Problem Solving & Troubleshooting in the Ubuntu OS	Sep 27, 2016	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Regulating Reward Training by Means of Certainty Prediction in a Neural Network-Implemented Pong Game	Sep 23, 2016	reinforcement-learningReinforcement Learning	—Unverified
Input Convex Neural Networks	Sep 22, 2016	ImputationInference Optimization	CodeCode Available
Learning Modular Neural Network Policies for Multi-Task and Multi-Robot Transfer	Sep 22, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Modelling Stock-market Investors as Reinforcement Learning Agents [Correction]	Sep 20, 2016	Decision MakingQ-Learning	—Unverified
Towards Deep Symbolic Reinforcement Learning	Sep 18, 2016	Deep Reinforcement LearningGame of Go	—Unverified
Opponent Modeling in Deep Reinforcement Learning	Sep 18, 2016	Deep Reinforcement LearningMixture-of-Experts	CodeCode Available
Playing FPS Games with Deep Reinforcement Learning	Sep 18, 2016	Deep Reinforcement LearningFPS Games	CodeCode Available
SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient	Sep 18, 2016	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Target-driven Visual Navigation in Indoor Scenes using Deep Reinforcement Learning	Sep 16, 2016	3D ReconstructionDeep Reinforcement Learning	CodeCode Available
The Option-Critic Architecture	Sep 16, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
Exploration Potential	Sep 16, 2016	Multi-Armed Banditsreinforcement-learning	—Unverified
Interactive Spoken Content Retrieval by Deep Reinforcement Learning	Sep 16, 2016	Deep Reinforcement LearningQ-Learning	—Unverified
Bayesian Reinforcement Learning: A Survey	Sep 14, 2016	Bayesian Inferencereinforcement-learning	—Unverified
Stochastic evolution in populations of ideas	Sep 14, 2016	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Threshold-based Scheme for Reinforcement Learning in Neural Networks	Sep 12, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
A centralized reinforcement learning method for multi-agent job scheduling in Grid	Sep 11, 2016	reinforcement-learningReinforcement Learning	—Unverified
Episodic Exploration for Deep Deterministic Policies: An Application to StarCraft Micromanagement Tasks	Sep 10, 2016	Q-Learningreinforcement-learning	—Unverified
Dialogue manager domain adaptation using Gaussian process reinforcement learning	Sep 9, 2016	Domain AdaptationGaussian Processes	—Unverified
Unifying task specification in reinforcement learning	Sep 7, 2016	reinforcement-learningReinforcement Learning	—Unverified
Towards End-to-End Reinforcement Learning of Dialogue Agents for Information Access	Sep 3, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
Reward Function and Initial Values: Better Choices for Accelerated Goal-Directed Reinforcement Learning	Sep 1, 2016	reinforcement-learningReinforcement Learning (RL)	—Unverified
Single photon in hierarchical architecture for physical reinforcement learning: Photon intelligence	Sep 1, 2016	Decision Makingreinforcement-learning	—Unverified
Adaptive Probabilistic Trajectory Optimization via Efficient Approximate Inference	Aug 22, 2016	Model Predictive ControlReinforcement Learning	—Unverified
Modeling Human Reading with Neural Attention	Aug 19, 2016	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 295 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified