Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14201–14250 of 15113 papers

Title	Date	Tasks	Status	Hype
Online Monotone Games	Oct 19, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Decomposition of Uncertainty in Bayesian Deep Learning for Efficient and Risk-sensitive Learning	Oct 19, 2017	Active LearningDecision Making	—Unverified	0
Asymmetric Actor Critic for Image-Based Robot Learning	Oct 18, 2017	Decision MakingDeep Reinforcement Learning	—Unverified	0
The Effects of Memory Replay in Reinforcement Learning	Oct 18, 2017	Deep Reinforcement LearningQ-Learning	CodeCode Available	0
Map-based Multi-Policy Reinforcement Learning: Enhancing Adaptability of Robots by Deep Reinforcement Learning	Oct 17, 2017	Bayesian OptimizationDeep Reinforcement Learning	—Unverified	0
Stochastic Variance Reduction for Policy Gradient Estimation	Oct 17, 2017	continuous-controlContinuous Control	—Unverified	0
Flow: A Modular Learning Framework for Mixed Autonomy Traffic	Oct 16, 2017	Autonomous VehiclesDeep Reinforcement Learning	CodeCode Available	2
Manifold Regularization for Kernelized LSTD	Oct 15, 2017	Policy Gradient MethodsReinforcement Learning	—Unverified	0
Is Epicurus the father of Reinforcement Learning?	Oct 12, 2017	Philosophyreinforcement-learning	—Unverified	0
PRM-RL: Long-range Robotic Navigation Tasks by Combining Reinforcement Learning and Sampling-based Planning	Oct 11, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Deep Reinforcement Learning: Framework, Applications, and Embedded Implementations	Oct 10, 2017	Cloud ComputingDeep Reinforcement Learning	—Unverified	0
On- and Off-Policy Monotonic Policy Improvement	Oct 10, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Meta Inverse Reinforcement Learning via Maximum Reward Sharing for Human Motion Analysis	Oct 7, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Rainbow: Combining Improvements in Deep Reinforcement Learning	Oct 6, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available	3
Exploration in Feature Space for Reinforcement Learning	Oct 5, 2017	Montezuma's Revengereinforcement-learning	—Unverified	0
Event Identification as a Decision Process with Non-linear Representation of Text	Oct 3, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Detecting Adversarial Attacks on Neural Network Policies with Visual Foresight	Oct 2, 2017	Autonomous VehiclesDecision Making	CodeCode Available	0
Attention-Aware Deep Reinforcement Learning for Video Face Recognition	Oct 1, 2017	Deep Reinforcement LearningFace Recognition	—Unverified	0
Parameter Sharing Deep Deterministic Policy Gradient for Cooperative Multi-agent Reinforcement Learning	Oct 1, 2017	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Learning how to learn: an adaptive dialogue agent for incrementally learning visually grounded word meanings	Sep 29, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Self-supervised Deep Reinforcement Learning with Generalized Computation Graphs for Robot Navigation	Sep 29, 2017	Deep Reinforcement LearningNavigate	CodeCode Available	0
Learning Complex Dexterous Manipulation with Deep Reinforcement Learning and Demonstrations	Sep 28, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep TAMER: Interactive Agent Shaping in High-Dimensional State Spaces	Sep 28, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Overcoming Exploration in Reinforcement Learning with Demonstrations	Sep 28, 2017	continuous-controlContinuous Control	CodeCode Available	0
Towards Optimally Decentralized Multi-Robot Collision Avoidance via Deep Reinforcement Learning	Sep 28, 2017	Collision AvoidanceDeep Reinforcement Learning	CodeCode Available	0
A Simple Reinforcement Learning Mechanism for Resource Allocation in LTE-A Networks with Markov Decision Process and Q-Learning	Sep 27, 2017	Q-Learningreinforcement-learning	—Unverified	0
A Policy Search Method For Temporal Logic Specified Reinforcement Learning Tasks	Sep 27, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Cold-Start Reinforcement Learning with Softmax Policy Gradient	Sep 27, 2017	Image CaptioningPolicy Gradient Methods	CodeCode Available	0
A Benchmark Environment Motivated by Industrial Control Problems	Sep 27, 2017	OpenAI GymReinforcement Learning	CodeCode Available	1
MDP environments for the OpenAI Gym	Sep 26, 2017	OpenAI Gymreinforcement-learning	CodeCode Available	0
Object-oriented Neural Programming (OONP) for Document Understanding	Sep 26, 2017	document understandingObject	—Unverified	0
Towards continuous control of flippers for a multi-terrain robot using deep reinforcement learning	Sep 25, 2017	continuous-controlContinuous Control	—Unverified	0
An Optimal Online Method of Selecting Source Policies for Reinforcement Learning	Sep 24, 2017	Q-Learningreinforcement-learning	—Unverified	0
Learning Unmanned Aerial Vehicle Control for Autonomous Target Following	Sep 24, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Bootstrapping incremental dialogue systems from minimal data: the generalisation power of dialogue grammars	Sep 22, 2017	Dialogue ManagementManagement	—Unverified	0
Inverse Reinforcement Learning with Conditional Choice Probabilities	Sep 22, 2017	Econometricsreinforcement-learning	—Unverified	0
Multiqubit and multilevel quantum reinforcement learning with quantum technologies	Sep 22, 2017	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
On overfitting and asymptotic bias in batch reinforcement learning with partial observability	Sep 22, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
OptLayer - Practical Constrained Optimization for Deep Reinforcement Learning in the Real World	Sep 22, 2017	Decision MakingDeep Reinforcement Learning	—Unverified	0
Local Communication Protocols for Learning Complex Swarm Behaviors with Deep Reinforcement Learning	Sep 21, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Neural Optimizer Search with Reinforcement Learning	Sep 21, 2017	Machine Translationreinforcement-learning	CodeCode Available	0
Feature Engineering for Predictive Modeling using Reinforcement Learning	Sep 21, 2017	Automated Feature EngineeringEfficient Exploration	—Unverified	0
A Deep-Reinforcement Learning Approach for Software-Defined Networking Routing Optimization	Sep 20, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Dexterous Manipulation with Concept Networks	Sep 20, 2017	Deep Reinforcement LearningMuJoCo	—Unverified	0
OptionGAN: Learning Joint Reward-Policy Options using Generative Adversarial Inverse Reinforcement Learning	Sep 20, 2017	continuous-controlContinuous Control	CodeCode Available	0
Deep Reinforcement Learning for Event-Driven Multi-Agent Decision Processes	Sep 19, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Sparse Markov Decision Processes with Causal Sparse Tsallis Entropy Regularization for Reinforcement Learning	Sep 19, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning that Matters	Sep 19, 2017	Atari GamesContinuous Control	CodeCode Available	0
Iterative Policy Learning in End-to-End Trainable Task-Oriented Neural Dialog Models	Sep 18, 2017	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
Guided Deep Reinforcement Learning for Swarm Systems	Sep 18, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0

Show:10 25 50

← PrevPage 285 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified