Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14251–14300 of 15113 papers

Title	Date	Tasks	Status
Distributional Reinforcement Learning with Quantile Regression	Oct 27, 2017	Atari GamesDistributional Reinforcement Learning	CodeCode Available
Generalization Tower Network: A Novel Deep Neural Network Architecture for Multi-Task Learning	Oct 27, 2017	Atari GamesMulti-Task Learning	CodeCode Available
Learning Approximate Stochastic Transition Models	Oct 26, 2017	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Accelerated Reinforcement Learning	Oct 23, 2017	Policy Gradient Methodsreinforcement-learning	—Unverified
Exploiting generalization in the subspaces for faster model-based learning	Oct 22, 2017	Decision MakingReinforcement Learning	—Unverified
Insulin Regimen ML-based control for T2DM patients	Oct 21, 2017	Model-based Reinforcement LearningReinforcement Learning	—Unverified
Decomposition of Uncertainty in Bayesian Deep Learning for Efficient and Risk-sensitive Learning	Oct 19, 2017	Active LearningDecision Making	—Unverified
Online Monotone Games	Oct 19, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
The Effects of Memory Replay in Reinforcement Learning	Oct 18, 2017	Deep Reinforcement LearningQ-Learning	CodeCode Available
Asymmetric Actor Critic for Image-Based Robot Learning	Oct 18, 2017	Decision MakingDeep Reinforcement Learning	—Unverified
Map-based Multi-Policy Reinforcement Learning: Enhancing Adaptability of Robots by Deep Reinforcement Learning	Oct 17, 2017	Bayesian OptimizationDeep Reinforcement Learning	—Unverified
Stochastic Variance Reduction for Policy Gradient Estimation	Oct 17, 2017	continuous-controlContinuous Control	—Unverified
Manifold Regularization for Kernelized LSTD	Oct 15, 2017	Policy Gradient MethodsReinforcement Learning	—Unverified
Is Epicurus the father of Reinforcement Learning?	Oct 12, 2017	Philosophyreinforcement-learning	—Unverified
PRM-RL: Long-range Robotic Navigation Tasks by Combining Reinforcement Learning and Sampling-based Planning	Oct 11, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
On- and Off-Policy Monotonic Policy Improvement	Oct 10, 2017	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning: Framework, Applications, and Embedded Implementations	Oct 10, 2017	Cloud ComputingDeep Reinforcement Learning	—Unverified
Meta Inverse Reinforcement Learning via Maximum Reward Sharing for Human Motion Analysis	Oct 7, 2017	reinforcement-learningReinforcement Learning	—Unverified
Exploration in Feature Space for Reinforcement Learning	Oct 5, 2017	Montezuma's Revengereinforcement-learning	—Unverified
Event Identification as a Decision Process with Non-linear Representation of Text	Oct 3, 2017	reinforcement-learningReinforcement Learning	—Unverified
Detecting Adversarial Attacks on Neural Network Policies with Visual Foresight	Oct 2, 2017	Autonomous VehiclesDecision Making	CodeCode Available
Attention-Aware Deep Reinforcement Learning for Video Face Recognition	Oct 1, 2017	Deep Reinforcement LearningFace Recognition	—Unverified
Parameter Sharing Deep Deterministic Policy Gradient for Cooperative Multi-agent Reinforcement Learning	Oct 1, 2017	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Self-supervised Deep Reinforcement Learning with Generalized Computation Graphs for Robot Navigation	Sep 29, 2017	Deep Reinforcement LearningNavigate	CodeCode Available
Learning how to learn: an adaptive dialogue agent for incrementally learning visually grounded word meanings	Sep 29, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Deep TAMER: Interactive Agent Shaping in High-Dimensional State Spaces	Sep 28, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Towards Optimally Decentralized Multi-Robot Collision Avoidance via Deep Reinforcement Learning	Sep 28, 2017	Collision AvoidanceDeep Reinforcement Learning	CodeCode Available
Overcoming Exploration in Reinforcement Learning with Demonstrations	Sep 28, 2017	continuous-controlContinuous Control	CodeCode Available
Cold-Start Reinforcement Learning with Softmax Policy Gradient	Sep 27, 2017	Image CaptioningPolicy Gradient Methods	CodeCode Available
A Policy Search Method For Temporal Logic Specified Reinforcement Learning Tasks	Sep 27, 2017	reinforcement-learningReinforcement Learning	—Unverified
A Simple Reinforcement Learning Mechanism for Resource Allocation in LTE-A Networks with Markov Decision Process and Q-Learning	Sep 27, 2017	Q-Learningreinforcement-learning	—Unverified
Object-oriented Neural Programming (OONP) for Document Understanding	Sep 26, 2017	document understandingObject	—Unverified
MDP environments for the OpenAI Gym	Sep 26, 2017	OpenAI Gymreinforcement-learning	CodeCode Available
Towards continuous control of flippers for a multi-terrain robot using deep reinforcement learning	Sep 25, 2017	continuous-controlContinuous Control	—Unverified
Learning Unmanned Aerial Vehicle Control for Autonomous Target Following	Sep 24, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
An Optimal Online Method of Selecting Source Policies for Reinforcement Learning	Sep 24, 2017	Q-Learningreinforcement-learning	—Unverified
Bootstrapping incremental dialogue systems from minimal data: the generalisation power of dialogue grammars	Sep 22, 2017	Dialogue ManagementManagement	—Unverified
Inverse Reinforcement Learning with Conditional Choice Probabilities	Sep 22, 2017	Econometricsreinforcement-learning	—Unverified
On overfitting and asymptotic bias in batch reinforcement learning with partial observability	Sep 22, 2017	reinforcement-learningReinforcement Learning	—Unverified
OptLayer - Practical Constrained Optimization for Deep Reinforcement Learning in the Real World	Sep 22, 2017	Decision MakingDeep Reinforcement Learning	—Unverified
Multiqubit and multilevel quantum reinforcement learning with quantum technologies	Sep 22, 2017	BIG-bench Machine Learningreinforcement-learning	—Unverified
Neural Optimizer Search with Reinforcement Learning	Sep 21, 2017	Machine Translationreinforcement-learning	CodeCode Available
Local Communication Protocols for Learning Complex Swarm Behaviors with Deep Reinforcement Learning	Sep 21, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Feature Engineering for Predictive Modeling using Reinforcement Learning	Sep 21, 2017	Automated Feature EngineeringEfficient Exploration	—Unverified
Deep Reinforcement Learning for Dexterous Manipulation with Concept Networks	Sep 20, 2017	Deep Reinforcement LearningMuJoCo	—Unverified
A Deep-Reinforcement Learning Approach for Software-Defined Networking Routing Optimization	Sep 20, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
OptionGAN: Learning Joint Reward-Policy Options using Generative Adversarial Inverse Reinforcement Learning	Sep 20, 2017	continuous-controlContinuous Control	CodeCode Available
Sparse Markov Decision Processes with Causal Sparse Tsallis Entropy Regularization for Reinforcement Learning	Sep 19, 2017	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning that Matters	Sep 19, 2017	Atari GamesContinuous Control	CodeCode Available
Deep Reinforcement Learning for Event-Driven Multi-Agent Decision Processes	Sep 19, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 286 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified