Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13601–13650 of 15113 papers

Title	Date	Tasks	Status
Interpretable Rationale Augmented Charge Prediction System	Aug 1, 2018	ClassificationDeep Reinforcement Learning	—Unverified
Distantly Supervised NER with Partial Annotation Learning and Reinforcement Learning	Aug 1, 2018	Chinese Named Entity Recognitionnamed-entity-recognition	CodeCode Available
Learning Dexterous In-Hand Manipulation	Aug 1, 2018	Frictionreinforcement-learning	—Unverified
A New Concept of Deep Reinforcement Learning based Augmented General Tagging System	Aug 1, 2018	Deep Reinforcement LearningNamed Entity Recognition (NER)	—Unverified
Count-Based Exploration with the Successor Representation	Jul 31, 2018	Atari GamesEfficient Exploration	CodeCode Available
Learning to Interrupt: A Hierarchical Deep Reinforcement Learning Framework for Efficient Exploration	Jul 30, 2018	Deep Reinforcement LearningEfficient Exploration	—Unverified
Improving Spatiotemporal Self-Supervision by Deep Reinforcement Learning	Jul 30, 2018	Deep Reinforcement LearningGeneral Classification	—Unverified
Optimal Tap Setting of Voltage Regulation Transformers Using Batch Reinforcement Learning	Jul 29, 2018	reinforcement-learningReinforcement Learning	—Unverified
Multi-modal Feedback for Affordance-driven Interactive Reinforcement Learning	Jul 26, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Reinforcement Learning Approach to Target Tracking in a Camera Network	Jul 26, 2018	Q-Learningreinforcement-learning	—Unverified
Backprop-Q: Generalized Backpropagation for Stochastic Computation Graphs	Jul 25, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Multi-Agent Reinforcement Learning: A Report on Challenges and Approaches	Jul 25, 2018	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Variational Bayesian Reinforcement Learning with Regret Bounds	Jul 25, 2018	Q-Learningreinforcement-learning	—Unverified
A Temporal Difference Reinforcement Learning Theory of Emotion: unifying emotion, cognition and adaptive behavior	Jul 24, 2018	Learning TheoryReinforcement Learning	—Unverified
Contrastive Explanations for Reinforcement Learning in terms of Expected Consequences	Jul 23, 2018	BIG-bench Machine Learningreinforcement-learning	—Unverified
Learning to Play Pong using Policy Gradient Learning	Jul 23, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Asynchronous Advantage Actor-Critic Agent for Starcraft II	Jul 22, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Accelerated Structure-Aware Reinforcement Learning for Delay-Sensitive Energy Harvesting Wireless Sensors	Jul 22, 2018	Q-Learningreinforcement-learning	—Unverified
NAVREN-RL: Learning to fly in real environment via end-to-end deep reinforcement learning using monocular images	Jul 22, 2018	Deep Reinforcement LearningNavigate	—Unverified
Learning Heuristics for Quantified Boolean Formulas through Deep Reinforcement Learning	Jul 20, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
FuzzerGym: A Competitive Framework for Fuzzing and Learning	Jul 19, 2018	Deep Reinforcement LearningFault Detection	—Unverified
Hierarchical Reinforcement Learning for Zero-shot Generalization with Subtask Dependencies	Jul 19, 2018	Hierarchical Reinforcement LearningNetwork Embedding	CodeCode Available
Towards Explainable and Controllable Open Domain Dialogue Generation with Dialogue Acts	Jul 19, 2018	Dialogue Generationreinforcement-learning	—Unverified
Self-Organizing Maps as a Storage and Transfer Mechanism in Reinforcement Learning	Jul 19, 2018	reinforcement-learningReinforcement Learning	—Unverified
News-based trading strategies	Jul 18, 2018	Decision MakingReinforcement Learning	—Unverified
Representational efficiency outweighs action efficiency in human program induction	Jul 18, 2018	Hierarchical Reinforcement LearningProgram induction	—Unverified
Backplay: "Man muss immer umkehren"	Jul 18, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Deep Reinforcement Learning for Swarm Systems	Jul 17, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available
Learning to Listen, Read, and Follow: Score Following as a Reinforcement Learning Game	Jul 17, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available
Foundations for Restraining Bolts: Reinforcement Learning with LTLf/LDLf restraining specifications	Jul 17, 2018	reinforcement-learningReinforcement Learning	—Unverified
Safe Reinforcement Learning via Probabilistic Shields	Jul 16, 2018	Decision Makingreinforcement-learning	—Unverified
Remember and Forget for Experience Replay	Jul 16, 2018	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Toward Interpretable Deep Reinforcement Learning with Linear Model U-Trees	Jul 16, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Online Robust Policy Learning in the Presence of Unknown Adversaries	Jul 16, 2018	Deep Reinforcement LearningOpenAI Gym	—Unverified
Discrete linear-complexity reinforcement learning in continuous action spaces for Q-learning algorithms	Jul 16, 2018	Q-Learningreinforcement-learning	—Unverified
Bipedal Walking Robot using Deep Deterministic Policy Gradient	Jul 16, 2018	BIG-bench Machine LearningDecision Making	CodeCode Available
Exploring Hierarchy-Aware Inverse Reinforcement Learning	Jul 13, 2018	BIRLreinforcement-learning	—Unverified
An Affective Robot Companion for Assisting the Elderly in a Cognitive Game Scenario	Jul 12, 2018	Decision MakingDialogue Management	—Unverified
The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach	Jul 12, 2018	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified
Will it Blend? Composing Value Functions in Reinforcement Learning	Jul 12, 2018	Lifelong learningreinforcement-learning	—Unverified
Algorithmic Framework for Model-based Deep Reinforcement Learning with Theoretical Guarantees	Jul 10, 2018	continuous-controlContinuous Control	CodeCode Available
CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving	Jul 10, 2018	Imitation Learningreinforcement-learning	—Unverified
Video Summarisation by Classification with Deep Reinforcement Learning	Jul 9, 2018	ClassificationDecision Making	—Unverified
Partial Policy-based Reinforcement Learning for Anatomical Landmark Localization in 3D Medical Images	Jul 9, 2018	reinforcement-learningReinforcement Learning	—Unverified
Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure	Jul 8, 2018	reinforcement-learningReinforcement Learning	—Unverified
Financial Trading as a Game: A Deep Reinforcement Learning Approach	Jul 8, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
End-to-End Race Driving with Deep Reinforcement Learning	Jul 6, 2018	Deep Reinforcement LearningDomain Adaptation	—Unverified
Variance Reduction for Reinforcement Learning in Input-Driven Environments	Jul 6, 2018	Meta-LearningMuJoCo	—Unverified
Deep Reinforcement Learning for Doom using Unsupervised Auxiliary Tasks	Jul 5, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Arcades: A deep model for adaptive decision making in voice controlled smart-home	Jul 5, 2018	Decision MakingDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 273 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified