Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13201–13250 of 15113 papers

Title	Date	Tasks	Status	Hype
Policy Certificates: Towards Accountable Reinforcement Learning	Nov 7, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Baselines for Reinforcement Learning in Text Games	Nov 7, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
ACE: An Actor Ensemble Algorithm for Continuous Control with Tree Search	Nov 6, 2018	continuous-controlContinuous Control	—Unverified	0
Deep Reinforcement Learning via L-BFGS Optimization	Nov 6, 2018	Atari GamesDeep Reinforcement Learning	—Unverified	0
Towards continual learning in medical imaging	Nov 6, 2018	Atari GamesContinual Learning	—Unverified	0
Adaptive Stress Testing: Finding Likely Failure Events with Reinforcement Learning	Nov 6, 2018	Autonomous DrivingCollision Avoidance	—Unverified	0
Deep Reinforcement Learning for Green Security Games with Real-Time Information	Nov 6, 2018	Deep Reinforcement LearningQ-Learning	—Unverified	0
A Biologically Plausible Learning Rule for Deep Learning in the Brain	Nov 5, 2018	Deep Learningimage-classification	CodeCode Available	0
Contingency-Aware Exploration in Reinforcement Learning	Nov 5, 2018	Atari GamesMontezuma's Revenge	—Unverified	0
Combining Subgoal Graphs with Reinforcement Learning to Build a Rational Pathfinder	Nov 5, 2018	Motion PlanningOptimal Motion Planning	—Unverified	0
Managing engineering systems with large state and action spaces through deep reinforcement learning	Nov 5, 2018	Decision MakingDeep Reinforcement Learning	—Unverified	0
QUOTA: The Quantile Option Architecture for Reinforcement Learning	Nov 5, 2018	Decision MakingDistributional Reinforcement Learning	CodeCode Available	0
ReLeQ: A Reinforcement Learning Approach for Deep Quantization of Neural Networks	Nov 5, 2018	Deep Reinforcement LearningQuantization	—Unverified	0
Reinforcement Learning based Dynamic Model Selection for Short-Term Load Forecasting	Nov 5, 2018	BIG-bench Machine LearningLoad Forecasting	—Unverified	0
Bayesian Action Decoder for Deep Multi-Agent Reinforcement Learning	Nov 4, 2018	DecoderMulti-agent Reinforcement Learning	CodeCode Available	1
Relation Mention Extraction from Noisy Data with Hierarchical Reinforcement Learning	Nov 3, 2018	DenoisingHierarchical Reinforcement Learning	—Unverified	0
VIREL: A Variational Inference Framework for Reinforcement Learning	Nov 3, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Sequence Generation with Guider Network	Nov 2, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Automated Theorem Proving in Intuitionistic Propositional Logic by Deep Reinforcement Learning	Nov 2, 2018	Automated Theorem ProvingData Augmentation	—Unverified	0
Dantzig Selector with an Approximately Optimal Denoising Matrix and its Application to Reinforcement Learning	Nov 2, 2018	compressed sensingDenoising	—Unverified	0
Shaping a social robot's humor with Natural Language Generation and socially-aware reinforcement learning	Nov 1, 2018	multimodal interactionreinforcement-learning	—Unverified	0
Macquarie University at BioASQ 6b: Deep learning and deep reinforcement learning for query-based summarisation	Nov 1, 2018	Deep LearningDeep Reinforcement Learning	—Unverified	0
Joint Modeling for Query Expansion and Information Extraction with Reinforcement Learning	Nov 1, 2018	Decision Makingreinforcement-learning	—Unverified	0
Approximate Dynamic Oracle for Dependency Parsing with Reinforcement Learning	Nov 1, 2018	Dependency ParsingImitation Learning	—Unverified	0
Horizon: Facebook's Open Source Applied Reinforcement Learning Platform	Nov 1, 2018	counterfactualreinforcement-learning	—Unverified	0
Temporal Regularization in Markov Decision Process	Nov 1, 2018	Atari Gamesreinforcement-learning	CodeCode Available	0
SDRL: Interpretable and Data-efficient Deep Reinforcement Learning Leveraging Symbolic Planning	Oct 31, 2018	Decision MakingDeep Reinforcement Learning	—Unverified	0
Towards a Simple Approach to Multi-step Model-based Reinforcement Learning	Oct 31, 2018	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Relative Importance Sampling for off-Policy Actor-Critic in Deep Reinforcement Learning	Oct 30, 2018	Deep Reinforcement LearningOpenAI Gym	—Unverified	0
Reinforcement Learning and Deep Learning based Lateral Control for Autonomous Driving	Oct 30, 2018	Autonomous DrivingDeep Learning	CodeCode Available	0
Exploration by Random Network Distillation	Oct 30, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
Gated Hierarchical Attention for Image Captioning	Oct 30, 2018	DecoderImage Captioning	CodeCode Available	1
Deep Reinforcement Learning based Recommendation with Explicit User-Item Interactions Modeling	Oct 29, 2018	Collaborative FilteringDecision Making	CodeCode Available	1
Assessing Generalization in Deep Reinforcement Learning	Oct 29, 2018	Deep Reinforcement LearningOut-of-Distribution Generalization	CodeCode Available	0
Model-Based Active Exploration	Oct 29, 2018	Efficient Explorationmodel	CodeCode Available	1
Social Vehicle Swarms: A Novel Perspective on Social-aware Vehicular Communication Architecture	Oct 29, 2018	Cloud ComputingDeep Reinforcement Learning	—Unverified	0
DQN-TAMER: Human-in-the-Loop Reinforcement Learning with Intractable Feedback	Oct 28, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Distributive Dynamic Spectrum Access through Deep Reinforcement Learning: A Reservoir Computing Based Approach	Oct 28, 2018	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified	0
Learn to Steer through Deep Reinforcement Learning	Oct 27, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Multi-Agent Common Knowledge Reinforcement Learning	Oct 27, 2018	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Neural Modular Control for Embodied Question Answering	Oct 26, 2018	Embodied Question AnsweringImitation Learning	CodeCode Available	0
Transfer of Deep Reactive Policies for MDP Planning	Oct 26, 2018	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	0
Stability-certified reinforcement learning: A control-theoretic perspective	Oct 26, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Empirical Evaluation of Contextual Policy Search with a Comparison-based Surrogate Model and Active Covariance Matrix Adaptation	Oct 26, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Differential Variable Speed Limits Control for Freeway Recurrent Bottlenecks via Deep Reinforcement learning	Oct 25, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Multi-Agent Reinforcement Learning Based Resource Allocation for UAV Networks	Oct 24, 2018	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
Sample-Efficient Learning of Nonprehensile Manipulation Policies via Physics-Based Informed State Distributions	Oct 24, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Inverse reinforcement learning for video games	Oct 24, 2018	continuous-controlContinuous Control	CodeCode Available	0
Making Sense of Vision and Touch: Self-Supervised Learning of Multimodal Representations for Contact-Rich Tasks	Oct 24, 2018	Contact-rich ManipulationDeep Reinforcement Learning	CodeCode Available	1
Learning Representations in Model-Free Hierarchical Reinforcement Learning	Oct 23, 2018	Hierarchical Reinforcement Learningmodel	—Unverified	0

Show:10 25 50

← PrevPage 265 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified