Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13451–13500 of 15113 papers

Title	Date	Tasks	Status	Hype
Dual-Agent Deep Reinforcement Learning for Deformable Face Tracking	Sep 1, 2018	Deep Reinforcement LearningFacial Landmark Detection	—Unverified	0
Deep Reinforcement Learning with Iterative Shift for Visual Tracking	Sep 1, 2018	Deep Reinforcement LearningMotion Estimation	—Unverified	0
Part-Activated Deep Reinforcement Learning for Action Prediction	Sep 1, 2018	Deep Reinforcement LearningPrediction	—Unverified	0
Snap Angle Prediction for 360Â° Panoramas	Sep 1, 2018	Predictionreinforcement-learning	—Unverified	0
A Contextual-bandit-based Approach for Informed Decision-making in Clinical Trials	Sep 1, 2018	Decision Makingreinforcement-learning	—Unverified	0
Ensemble Sequence Level Training for Multimodal MT: OSU-Baidu WMT18 Multimodal Machine Translation System Report	Aug 31, 2018	DecoderMachine Translation	—Unverified	0
APES: a Python toolbox for simulating reinforcement learning environments	Aug 31, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Directed Exploration in PAC Model-Free Reinforcement Learning	Aug 31, 2018	Efficient Explorationmodel	—Unverified	0
Multi-Hop Knowledge Graph Reasoning with Reward Shaping	Aug 31, 2018	Knowledge Graph EmbeddingsKnowledge Graphs	CodeCode Available	1
Application of Self-Play Reinforcement Learning to a Four-Player Game of Imperfect Information	Aug 30, 2018	Card Gamesreinforcement-learning	CodeCode Available	0
ExIt-OOS: Towards Learning from Planning in Imperfect Information Games	Aug 30, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
A Reinforcement Learning-driven Translation Model for Search-Oriented Conversational Systems	Aug 29, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
APRIL: Interactively Learning to Summarise by Combining Active Preference Learning and Reinforcement Learning	Aug 29, 2018	Active Learningreinforcement-learning	CodeCode Available	0
Learning a Policy for Opportunistic Active Learning	Aug 29, 2018	Active LearningObject	—Unverified	0
Decoupling Strategy and Generation in Negotiation Dialogues	Aug 29, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	1
Adversarial Deep Reinforcement Learning in Portfolio Management	Aug 29, 2018	Deep Reinforcement LearningManagement	CodeCode Available	1
Optimal control of eye-movements during visual search	Aug 28, 2018	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
SOLAR: Deep Structured Representations for Model-Based Reinforcement Learning	Aug 28, 2018	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	0
High-confidence error estimates for learned value functions	Aug 28, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Cycle-of-Learning for Autonomous Systems from Human Interaction	Aug 28, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
A Study of Reinforcement Learning for Neural Machine Translation	Aug 27, 2018	Machine TranslationNMT	CodeCode Available	0
NavigationNet: A Large-scale Interactive Indoor Navigation Dataset	Aug 25, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Proximal Policy Optimization and its Dynamic Version for Sequence Generation	Aug 24, 2018	ChatbotModel Optimization	—Unverified	0
Reinforcement Learning for Relation Classification from Noisy Data	Aug 24, 2018	Classificationreinforcement-learning	CodeCode Available	1
Playing 20 Question Game with Policy-Based Reinforcement Learning	Aug 23, 2018	ObjectQuestion Selection	—Unverified	0
LIFT: Reinforcement Learning in Computer Systems by Learning From Demonstrations	Aug 23, 2018	Deep Reinforcement LearningManagement	CodeCode Available	0
Exploring Shared Structures and Hierarchies for Multiple NLP Tasks	Aug 23, 2018	General ClassificationMulti-Task Learning	—Unverified	0
Interactive Semantic Parsing for If-Then Recipes via Hierarchical Reinforcement Learning	Aug 21, 2018	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	0
Goal-oriented Dialogue Policy Learning from Failures	Aug 20, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Catastrophic Importance of Catastrophic Forgetting	Aug 20, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Source-Critical Reinforcement Learning for Transferring Spoken Language Understanding to a New Language	Aug 19, 2018	Cultural Vocal Bursts Intensity Predictiondomain classification	—Unverified	0
Reinforcement Learning for Autonomous Defence in Software-Defined Networking	Aug 17, 2018	BIG-bench Machine LearningGeneral Classification	—Unverified	0
Importance mixing: Improving sample reuse in evolutionary policy search methods	Aug 17, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Data Poisoning Attacks in Contextual Bandits	Aug 17, 2018	Data PoisoningMulti-Armed Bandits	—Unverified	0
Context-Aware Visual Policy Network for Sequence-Level Image Captioning	Aug 16, 2018	Deep Reinforcement LearningImage Captioning	CodeCode Available	0
Incorporating Consistency Verification into Neural Data-to-Document Generation	Aug 15, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Deep RTS: A Game Environment for Deep Reinforcement Learning in Real-Time Strategy Games	Aug 15, 2018	Deep Reinforcement LearningReal-Time Strategy Games	CodeCode Available	0
A Framework for Automated Cellular Network Tuning with Reinforcement Learning	Aug 13, 2018	ManagementQ-Learning	CodeCode Available	0
Directed Policy Gradient for Safe Reinforcement Learning with Human Advice	Aug 13, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Visual Sensor Network Reconfiguration with Deep Reinforcement Learning	Aug 13, 2018	Deep Reinforcement Learningobject-detection	—Unverified	0
End-to-end Active Object Tracking and Its Real-world Deployment via Reinforcement Learning	Aug 10, 2018	Deep Reinforcement LearningObject	—Unverified	0
Policy Optimization as Wasserstein Gradient Flows	Aug 9, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Learning to Share and Hide Intentions using Information Regularization	Aug 6, 2018	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
An Efficient Deep Reinforcement Learning Model for Urban Traffic Control	Aug 6, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Regret Bounds for Reinforcement Learning via Markov Chain Concentration	Aug 6, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
RecoGym: A Reinforcement Learning Environment for the problem of Product Recommendation in Online Advertising	Aug 2, 2018	Product RecommendationRecommendation Systems	CodeCode Available	0
Source Critical Reinforcement Learning for Transferring Spoken Language Understanding to a New Language	Aug 1, 2018	Cultural Vocal Bursts Intensity Predictiondomain classification	—Unverified	0
Interpretable Rationale Augmented Charge Prediction System	Aug 1, 2018	ClassificationDeep Reinforcement Learning	—Unverified	0
Distantly Supervised NER with Partial Annotation Learning and Reinforcement Learning	Aug 1, 2018	Chinese Named Entity Recognitionnamed-entity-recognition	CodeCode Available	0
A New Concept of Deep Reinforcement Learning based Augmented General Tagging System	Aug 1, 2018	Deep Reinforcement LearningNamed Entity Recognition (NER)	—Unverified	0

Show:10 25 50

← PrevPage 270 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified