Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14301–14350 of 15113 papers

Title	Date	Tasks	Status	Hype
Attention-Aware Face Hallucination via Deep Reinforcement Learning	Aug 10, 2017	Deep Reinforcement LearningFace Hallucination	—Unverified	0
Reproducibility of Benchmarked Deep Reinforcement Learning Tasks for Continuous Control	Aug 10, 2017	continuous-controlContinuous Control	CodeCode Available	0
A Machine Learning Approach to Routing	Aug 10, 2017	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified	0
Decoupled Learning of Environment Characteristics for Safe Exploration	Aug 9, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Learning how to Active Learn: A Deep Reinforcement Learning Approach	Aug 8, 2017	Active LearningDeep Reinforcement Learning	CodeCode Available	0
Investigating Reinforcement Learning Agents for Continuous State Space Environments	Aug 8, 2017	OpenAI GymQ-Learning	—Unverified	0
Neural Network Dynamics for Model-Based Deep Reinforcement Learning with Model-Free Fine-Tuning	Aug 8, 2017	Deep Reinforcement Learningmodel	CodeCode Available	0
Reinforced Video Captioning with Entailment Rewards	Aug 7, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
An Information-Theoretic Optimality Principle for Deep Reinforcement Learning	Aug 6, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Effective sketching methods for value function approximation	Aug 3, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Reinforcement learning techniques for Outer Loop Link Adaptation in 4G/5G systems	Aug 3, 2017	Multi-Armed Banditsreinforcement-learning	—Unverified	0
The UMD Neural Machine Translation Systems at WMT17 Bandit Learning Task	Aug 3, 2017	Domain AdaptationMachine Translation	—Unverified	0
Variational Generative Stochastic Networks with Collaborative Shaping	Aug 2, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Deep Reinforcement Learning for Inquiry Dialog Policies with Logical Formula Embeddings	Aug 2, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Hierarchy Through Composition with Multitask LMDPs	Aug 1, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
World of Bits: An Open-Domain Platform for Web-Based Agents	Aug 1, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Neural Optimizer Search using Reinforcement Learning	Aug 1, 2017	Machine Translationreinforcement-learning	—Unverified	0
Using Reinforcement Learning to Model Incrementality in a Fast-Paced Dialogue Game	Aug 1, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Plan, Attend, Generate: Character-Level Neural Machine Translation with Planning	Aug 1, 2017	DecoderHierarchical Reinforcement Learning	—Unverified	0
Grounding Language for Transfer in Deep Reinforcement Learning	Aug 1, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Advantages and Limitations of using Successor Features for Transfer in Reinforcement Learning	Jul 31, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Spectrum Access In Cognitive Radio Using A Two Stage Reinforcement Learning Approach	Jul 31, 2017	channel selectionreinforcement-learning	—Unverified	0
Meta-SGD: Learning to Learn Quickly for Few-Shot Learning	Jul 31, 2017	Few-Shot LearningMeta-Learning	CodeCode Available	1
Learning to Teach Reinforcement Learning Agents	Jul 28, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Inverse Reinforcement Learning in Large State Spaces via Function Approximation	Jul 28, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Leveraging Demonstrations for Deep Reinforcement Learning on Robotics Problems with Sparse Rewards	Jul 27, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Learning Sparse Representations in Reinforcement Learning with Sparse Coding	Jul 26, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Guiding Reinforcement Learning Exploration Using Natural Language	Jul 26, 2017	DecoderMachine Translation	—Unverified	0
DARLA: Improving Zero-Shot Transfer in Reinforcement Learning	Jul 26, 2017	Deep Reinforcement LearningDomain Adaptation	CodeCode Available	0
Bellman Gradient Iteration for Inverse Reinforcement Learning	Jul 24, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning for Bandit Neural Machine Translation with Simulated Human Feedback	Jul 24, 2017	DecoderMachine Translation	CodeCode Available	0
A Distributional Perspective on Reinforcement Learning	Jul 21, 2017	Atari Gamesreinforcement-learning	CodeCode Available	1
A multi-agent reinforcement learning model of common-pool resource appropriation	Jul 20, 2017	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	1
DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning	Jul 20, 2017	DiversityGraph Embedding	CodeCode Available	0
Reward-Balancing for Statistical Spoken Dialogue Systems using Multi-objective Reinforcement Learning	Jul 19, 2017	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified	0
Imagination-Augmented Agents for Deep Reinforcement Learning	Jul 19, 2017	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	0
On-line Building Energy Optimization using Deep Reinforcement Learning	Jul 18, 2017	Deep Reinforcement Learningenergy management	—Unverified	0
Trial without Error: Towards Safe Reinforcement Learning via Human Intervention	Jul 17, 2017	Atari Gamesreinforcement-learning	CodeCode Available	0
Tracking as Online Decision-Making: Learning a Policy from Streaming Videos with Reinforcement Learning	Jul 17, 2017	Decision MakingDeep Reinforcement Learning	—Unverified	0
Reverse Curriculum Generation for Reinforcement Learning	Jul 17, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Efficient Architecture Search by Network Transformation	Jul 16, 2017	Image ClassificationNeural Architecture Search	CodeCode Available	0
Freeway Merging in Congested Traffic based on Multipolicy Decision Making with Passive Actor Critic	Jul 14, 2017	Decision Makingreinforcement-learning	—Unverified	0
Lenient Multi-Agent Deep Reinforcement Learning	Jul 14, 2017	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	1
Distral: Robust Multitask Reinforcement Learning	Jul 13, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Representation Learning for Grounded Spatial Reasoning	Jul 13, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Autoencoder-augmented Neuroevolution for Visual Doom Playing	Jul 12, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Fastest Convergence for Q-learning	Jul 12, 2017	Q-Learningreinforcement-learning	—Unverified	0
Value Prediction Network	Jul 11, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Deep Reinforcement Learning Attention Selection for Person Re-Identification	Jul 10, 2017	Deep Reinforcement LearningPerson Re-Identification	—Unverified	0
Q-Learning Algorithm for VoLTE Closed-Loop Power Control in Indoor Small Cells	Jul 10, 2017	Q-LearningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 287 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified