Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13551–13600 of 15113 papers

Title	Date	Tasks	Status
Natural Language Person Search Using Deep Reinforcement Learning	Sep 2, 2018	Deep Reinforcement Learningobject-detection	—Unverified
Part-Activated Deep Reinforcement Learning for Action Prediction	Sep 1, 2018	Deep Reinforcement LearningPrediction	—Unverified
Snap Angle Prediction for 360Â° Panoramas	Sep 1, 2018	Predictionreinforcement-learning	—Unverified
Goal-Oriented Visual Question Generation via Intermediate Rewards	Sep 1, 2018	Deep Reinforcement LearningInformativeness	—Unverified
Collaborative Deep Reinforcement Learning for Multi-Object Tracking	Sep 1, 2018	Deep Reinforcement LearningMulti-Object Tracking	—Unverified
Deep Reinforcement Learning with Iterative Shift for Visual Tracking	Sep 1, 2018	Deep Reinforcement LearningMotion Estimation	—Unverified
Dual-Agent Deep Reinforcement Learning for Deformable Face Tracking	Sep 1, 2018	Deep Reinforcement LearningFacial Landmark Detection	—Unverified
A Contextual-bandit-based Approach for Informed Decision-making in Clinical Trials	Sep 1, 2018	Decision Makingreinforcement-learning	—Unverified
Directed Exploration in PAC Model-Free Reinforcement Learning	Aug 31, 2018	Efficient Explorationmodel	—Unverified
Ensemble Sequence Level Training for Multimodal MT: OSU-Baidu WMT18 Multimodal Machine Translation System Report	Aug 31, 2018	DecoderMachine Translation	—Unverified
APES: a Python toolbox for simulating reinforcement learning environments	Aug 31, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
ExIt-OOS: Towards Learning from Planning in Imperfect Information Games	Aug 30, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Application of Self-Play Reinforcement Learning to a Four-Player Game of Imperfect Information	Aug 30, 2018	Card Gamesreinforcement-learning	CodeCode Available
A Reinforcement Learning-driven Translation Model for Search-Oriented Conversational Systems	Aug 29, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning a Policy for Opportunistic Active Learning	Aug 29, 2018	Active LearningObject	—Unverified
APRIL: Interactively Learning to Summarise by Combining Active Preference Learning and Reinforcement Learning	Aug 29, 2018	Active Learningreinforcement-learning	CodeCode Available
Cycle-of-Learning for Autonomous Systems from Human Interaction	Aug 28, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
High-confidence error estimates for learned value functions	Aug 28, 2018	reinforcement-learningReinforcement Learning	—Unverified
SOLAR: Deep Structured Representations for Model-Based Reinforcement Learning	Aug 28, 2018	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Optimal control of eye-movements during visual search	Aug 28, 2018	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Study of Reinforcement Learning for Neural Machine Translation	Aug 27, 2018	Machine TranslationNMT	CodeCode Available
NavigationNet: A Large-scale Interactive Indoor Navigation Dataset	Aug 25, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Proximal Policy Optimization and its Dynamic Version for Sequence Generation	Aug 24, 2018	ChatbotModel Optimization	—Unverified
Playing 20 Question Game with Policy-Based Reinforcement Learning	Aug 23, 2018	ObjectQuestion Selection	—Unverified
Exploring Shared Structures and Hierarchies for Multiple NLP Tasks	Aug 23, 2018	General ClassificationMulti-Task Learning	—Unverified
LIFT: Reinforcement Learning in Computer Systems by Learning From Demonstrations	Aug 23, 2018	Deep Reinforcement LearningManagement	CodeCode Available
Interactive Semantic Parsing for If-Then Recipes via Hierarchical Reinforcement Learning	Aug 21, 2018	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available
Catastrophic Importance of Catastrophic Forgetting	Aug 20, 2018	reinforcement-learningReinforcement Learning	—Unverified
Goal-oriented Dialogue Policy Learning from Failures	Aug 20, 2018	reinforcement-learningReinforcement Learning	—Unverified
Source-Critical Reinforcement Learning for Transferring Spoken Language Understanding to a New Language	Aug 19, 2018	Cultural Vocal Bursts Intensity Predictiondomain classification	—Unverified
Reinforcement Learning for Autonomous Defence in Software-Defined Networking	Aug 17, 2018	BIG-bench Machine LearningGeneral Classification	—Unverified
Importance mixing: Improving sample reuse in evolutionary policy search methods	Aug 17, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Data Poisoning Attacks in Contextual Bandits	Aug 17, 2018	Data PoisoningMulti-Armed Bandits	—Unverified
Context-Aware Visual Policy Network for Sequence-Level Image Captioning	Aug 16, 2018	Deep Reinforcement LearningImage Captioning	CodeCode Available
Deep RTS: A Game Environment for Deep Reinforcement Learning in Real-Time Strategy Games	Aug 15, 2018	Deep Reinforcement LearningReal-Time Strategy Games	CodeCode Available
Incorporating Consistency Verification into Neural Data-to-Document Generation	Aug 15, 2018	reinforcement-learningReinforcement Learning	—Unverified
Directed Policy Gradient for Safe Reinforcement Learning with Human Advice	Aug 13, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Framework for Automated Cellular Network Tuning with Reinforcement Learning	Aug 13, 2018	ManagementQ-Learning	CodeCode Available
Visual Sensor Network Reconfiguration with Deep Reinforcement Learning	Aug 13, 2018	Deep Reinforcement Learningobject-detection	—Unverified
End-to-end Active Object Tracking and Its Real-world Deployment via Reinforcement Learning	Aug 10, 2018	Deep Reinforcement LearningObject	—Unverified
Policy Optimization as Wasserstein Gradient Flows	Aug 9, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Regret Bounds for Reinforcement Learning via Markov Chain Concentration	Aug 6, 2018	reinforcement-learningReinforcement Learning	—Unverified
An Efficient Deep Reinforcement Learning Model for Urban Traffic Control	Aug 6, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Learning to Share and Hide Intentions using Information Regularization	Aug 6, 2018	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
RecoGym: A Reinforcement Learning Environment for the problem of Product Recommendation in Online Advertising	Aug 2, 2018	Product RecommendationRecommendation Systems	CodeCode Available
Structured Dialogue Policy with Graph Neural Networks	Aug 1, 2018	Automatic Speech Recognition (ASR)Decision Making	—Unverified
Source Critical Reinforcement Learning for Transferring Spoken Language Understanding to a New Language	Aug 1, 2018	Cultural Vocal Bursts Intensity Predictiondomain classification	—Unverified
Multi-Agent Deep Reinforcement Learning for Dynamic Power Allocation in Wireless Networks	Aug 1, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available
Neural Math Word Problem Solver with Reinforcement Learning	Aug 1, 2018	Feature EngineeringMath	—Unverified
A Reinforcement Learning Framework for Natural Question Generation using Bi-discriminators	Aug 1, 2018	AttributeNatural Questions	—Unverified

Show:10 25 50

← PrevPage 272 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified