Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14351–14400 of 15113 papers

Title	Date	Tasks	Status
A Machine Learning Approach to Routing	Aug 10, 2017	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Reproducibility of Benchmarked Deep Reinforcement Learning Tasks for Continuous Control	Aug 10, 2017	continuous-controlContinuous Control	CodeCode Available
Decoupled Learning of Environment Characteristics for Safe Exploration	Aug 9, 2017	reinforcement-learningReinforcement Learning	—Unverified
Learning how to Active Learn: A Deep Reinforcement Learning Approach	Aug 8, 2017	Active LearningDeep Reinforcement Learning	CodeCode Available
Investigating Reinforcement Learning Agents for Continuous State Space Environments	Aug 8, 2017	OpenAI GymQ-Learning	—Unverified
Neural Network Dynamics for Model-Based Deep Reinforcement Learning with Model-Free Fine-Tuning	Aug 8, 2017	Deep Reinforcement Learningmodel	CodeCode Available
Reinforced Video Captioning with Entailment Rewards	Aug 7, 2017	reinforcement-learningReinforcement Learning	—Unverified
An Information-Theoretic Optimality Principle for Deep Reinforcement Learning	Aug 6, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Effective sketching methods for value function approximation	Aug 3, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
The UMD Neural Machine Translation Systems at WMT17 Bandit Learning Task	Aug 3, 2017	Domain AdaptationMachine Translation	—Unverified
Reinforcement learning techniques for Outer Loop Link Adaptation in 4G/5G systems	Aug 3, 2017	Multi-Armed Banditsreinforcement-learning	—Unverified
Variational Generative Stochastic Networks with Collaborative Shaping	Aug 2, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Inquiry Dialog Policies with Logical Formula Embeddings	Aug 2, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hierarchy Through Composition with Multitask LMDPs	Aug 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Grounding Language for Transfer in Deep Reinforcement Learning	Aug 1, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Using Reinforcement Learning to Model Incrementality in a Fast-Paced Dialogue Game	Aug 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Neural Optimizer Search using Reinforcement Learning	Aug 1, 2017	Machine Translationreinforcement-learning	—Unverified
World of Bits: An Open-Domain Platform for Web-Based Agents	Aug 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Plan, Attend, Generate: Character-Level Neural Machine Translation with Planning	Aug 1, 2017	DecoderHierarchical Reinforcement Learning	—Unverified
Spectrum Access In Cognitive Radio Using A Two Stage Reinforcement Learning Approach	Jul 31, 2017	channel selectionreinforcement-learning	—Unverified
Advantages and Limitations of using Successor Features for Transfer in Reinforcement Learning	Jul 31, 2017	reinforcement-learningReinforcement Learning	—Unverified
Inverse Reinforcement Learning in Large State Spaces via Function Approximation	Jul 28, 2017	reinforcement-learningReinforcement Learning	—Unverified
Learning to Teach Reinforcement Learning Agents	Jul 28, 2017	reinforcement-learningReinforcement Learning	—Unverified
Leveraging Demonstrations for Deep Reinforcement Learning on Robotics Problems with Sparse Rewards	Jul 27, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Learning Sparse Representations in Reinforcement Learning with Sparse Coding	Jul 26, 2017	reinforcement-learningReinforcement Learning	—Unverified
Guiding Reinforcement Learning Exploration Using Natural Language	Jul 26, 2017	DecoderMachine Translation	—Unverified
DARLA: Improving Zero-Shot Transfer in Reinforcement Learning	Jul 26, 2017	Deep Reinforcement LearningDomain Adaptation	CodeCode Available
Bellman Gradient Iteration for Inverse Reinforcement Learning	Jul 24, 2017	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Bandit Neural Machine Translation with Simulated Human Feedback	Jul 24, 2017	DecoderMachine Translation	CodeCode Available
DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning	Jul 20, 2017	DiversityGraph Embedding	CodeCode Available
Imagination-Augmented Agents for Deep Reinforcement Learning	Jul 19, 2017	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available
Reward-Balancing for Statistical Spoken Dialogue Systems using Multi-objective Reinforcement Learning	Jul 19, 2017	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified
On-line Building Energy Optimization using Deep Reinforcement Learning	Jul 18, 2017	Deep Reinforcement Learningenergy management	—Unverified
Reverse Curriculum Generation for Reinforcement Learning	Jul 17, 2017	reinforcement-learningReinforcement Learning	—Unverified
Tracking as Online Decision-Making: Learning a Policy from Streaming Videos with Reinforcement Learning	Jul 17, 2017	Decision MakingDeep Reinforcement Learning	—Unverified
Trial without Error: Towards Safe Reinforcement Learning via Human Intervention	Jul 17, 2017	Atari Gamesreinforcement-learning	CodeCode Available
Efficient Architecture Search by Network Transformation	Jul 16, 2017	Image ClassificationNeural Architecture Search	CodeCode Available
Freeway Merging in Congested Traffic based on Multipolicy Decision Making with Passive Actor Critic	Jul 14, 2017	Decision Makingreinforcement-learning	—Unverified
Distral: Robust Multitask Reinforcement Learning	Jul 13, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Representation Learning for Grounded Spatial Reasoning	Jul 13, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Fastest Convergence for Q-learning	Jul 12, 2017	Q-Learningreinforcement-learning	—Unverified
Autoencoder-augmented Neuroevolution for Visual Doom Playing	Jul 12, 2017	reinforcement-learningReinforcement Learning	—Unverified
Value Prediction Network	Jul 11, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available
Q-Learning Algorithm for VoLTE Closed-Loop Power Control in Indoor Small Cells	Jul 10, 2017	Q-LearningReinforcement Learning	—Unverified
Deep Reinforcement Learning Attention Selection for Person Re-Identification	Jul 10, 2017	Deep Reinforcement LearningPerson Re-Identification	—Unverified
Deep Q-Learning for Self-Organizing Networks Fault Management and Radio Performance Improvement	Jul 10, 2017	Deep Reinforcement LearningManagement	—Unverified
Learning human behaviors from motion capture by adversarial imitation	Jul 7, 2017	Deep Reinforcement LearningImitation Learning	CodeCode Available
Trust-PCL: An Off-Policy Trust Region Method for Continuous Control	Jul 6, 2017	continuous-controlContinuous Control	—Unverified
The Complex Negotiation Dialogue Game	Jul 5, 2017	One-Shot LearningPosition	—Unverified
Learning to Design Games: Strategic Environments in Reinforcement Learning	Jul 5, 2017	Game Designreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 288 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified