Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13501–13550 of 15113 papers

Title	Date	Tasks	Status	Hype
A Reinforcement Learning Framework for Natural Question Generation using Bi-discriminators	Aug 1, 2018	AttributeNatural Questions	—Unverified	0
Neural Math Word Problem Solver with Reinforcement Learning	Aug 1, 2018	Feature EngineeringMath	—Unverified	0
Structured Dialogue Policy with Graph Neural Networks	Aug 1, 2018	Automatic Speech Recognition (ASR)Decision Making	—Unverified	0
Multi-Agent Deep Reinforcement Learning for Dynamic Power Allocation in Wireless Networks	Aug 1, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available	0
Learning Dexterous In-Hand Manipulation	Aug 1, 2018	Frictionreinforcement-learning	—Unverified	0
Count-Based Exploration with the Successor Representation	Jul 31, 2018	Atari GamesEfficient Exploration	CodeCode Available	0
Learning to Interrupt: A Hierarchical Deep Reinforcement Learning Framework for Efficient Exploration	Jul 30, 2018	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
Improving Spatiotemporal Self-Supervision by Deep Reinforcement Learning	Jul 30, 2018	Deep Reinforcement LearningGeneral Classification	—Unverified	0
Optimal Tap Setting of Voltage Regulation Transformers Using Batch Reinforcement Learning	Jul 29, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Multi-Agent Generative Adversarial Imitation Learning	Jul 26, 2018	Imitation Learningreinforcement-learning	CodeCode Available	1
Multi-modal Feedback for Affordance-driven Interactive Reinforcement Learning	Jul 26, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
A Reinforcement Learning Approach to Target Tracking in a Camera Network	Jul 26, 2018	Q-Learningreinforcement-learning	—Unverified	0
Backprop-Q: Generalized Backpropagation for Stochastic Computation Graphs	Jul 25, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Multi-Agent Reinforcement Learning: A Report on Challenges and Approaches	Jul 25, 2018	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Variational Bayesian Reinforcement Learning with Regret Bounds	Jul 25, 2018	Q-Learningreinforcement-learning	—Unverified	0
A Temporal Difference Reinforcement Learning Theory of Emotion: unifying emotion, cognition and adaptive behavior	Jul 24, 2018	Learning TheoryReinforcement Learning	—Unverified	0
Learning to Play Pong using Policy Gradient Learning	Jul 23, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Contrastive Explanations for Reinforcement Learning in terms of Expected Consequences	Jul 23, 2018	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Accelerated Structure-Aware Reinforcement Learning for Delay-Sensitive Energy Harvesting Wireless Sensors	Jul 22, 2018	Q-Learningreinforcement-learning	—Unverified	0
Asynchronous Advantage Actor-Critic Agent for Starcraft II	Jul 22, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
NAVREN-RL: Learning to fly in real environment via end-to-end deep reinforcement learning using monocular images	Jul 22, 2018	Deep Reinforcement LearningNavigate	—Unverified	0
Learning Heuristics for Quantified Boolean Formulas through Deep Reinforcement Learning	Jul 20, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Hierarchical Reinforcement Learning for Zero-shot Generalization with Subtask Dependencies	Jul 19, 2018	Hierarchical Reinforcement LearningNetwork Embedding	CodeCode Available	0
FuzzerGym: A Competitive Framework for Fuzzing and Learning	Jul 19, 2018	Deep Reinforcement LearningFault Detection	—Unverified	0
Towards Explainable and Controllable Open Domain Dialogue Generation with Dialogue Acts	Jul 19, 2018	Dialogue Generationreinforcement-learning	—Unverified	0
Self-Organizing Maps as a Storage and Transfer Mechanism in Reinforcement Learning	Jul 19, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Representational efficiency outweighs action efficiency in human program induction	Jul 18, 2018	Hierarchical Reinforcement LearningProgram induction	—Unverified	0
News-based trading strategies	Jul 18, 2018	Decision MakingReinforcement Learning	—Unverified	0
Backplay: "Man muss immer umkehren"	Jul 18, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Learning to Listen, Read, and Follow: Score Following as a Reinforcement Learning Game	Jul 17, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Deep Reinforcement Learning for Swarm Systems	Jul 17, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Foundations for Restraining Bolts: Reinforcement Learning with LTLf/LDLf restraining specifications	Jul 17, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Remember and Forget for Experience Replay	Jul 16, 2018	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available	0
Safe Reinforcement Learning via Probabilistic Shields	Jul 16, 2018	Decision Makingreinforcement-learning	—Unverified	0
Toward Interpretable Deep Reinforcement Learning with Linear Model U-Trees	Jul 16, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Online Robust Policy Learning in the Presence of Unknown Adversaries	Jul 16, 2018	Deep Reinforcement LearningOpenAI Gym	—Unverified	0
Discrete linear-complexity reinforcement learning in continuous action spaces for Q-learning algorithms	Jul 16, 2018	Q-Learningreinforcement-learning	—Unverified	0
Bipedal Walking Robot using Deep Deterministic Policy Gradient	Jul 16, 2018	BIG-bench Machine LearningDecision Making	CodeCode Available	0
Exploring Hierarchy-Aware Inverse Reinforcement Learning	Jul 13, 2018	BIRLreinforcement-learning	—Unverified	0
An Affective Robot Companion for Assisting the Elderly in a Cognitive Game Scenario	Jul 12, 2018	Decision MakingDialogue Management	—Unverified	0
Visual Reinforcement Learning with Imagined Goals	Jul 12, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	2
The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach	Jul 12, 2018	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified	0
Will it Blend? Composing Value Functions in Reinforcement Learning	Jul 12, 2018	Lifelong learningreinforcement-learning	—Unverified	0
Algorithmic Framework for Model-based Deep Reinforcement Learning with Theoretical Guarantees	Jul 10, 2018	continuous-controlContinuous Control	CodeCode Available	0
CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving	Jul 10, 2018	Imitation Learningreinforcement-learning	—Unverified	0
Is Q-learning Provably Efficient?	Jul 10, 2018	Q-LearningReinforcement Learning	CodeCode Available	1
Partial Policy-based Reinforcement Learning for Anatomical Landmark Localization in 3D Medical Images	Jul 9, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Video Summarisation by Classification with Deep Reinforcement Learning	Jul 9, 2018	ClassificationDecision Making	—Unverified	0
Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure	Jul 8, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Financial Trading as a Game: A Deep Reinforcement Learning Approach	Jul 8, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0

Show:10 25 50

← PrevPage 271 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified