Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13801–13850 of 15113 papers

Title	Date	Tasks	Status	Hype
Cell Selection with Deep Reinforcement Learning in Sparse Mobile Crowdsensing	Apr 19, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Lipschitz Continuity in Model-based Reinforcement Learning	Apr 19, 2018	modelModel-based Reinforcement Learning	CodeCode Available	0
Dialogue Learning with Human Teaching and Feedback in End-to-End Trainable Task-Oriented Dialogue Systems	Apr 18, 2018	Dialogue State TrackingImitation Learning	CodeCode Available	0
A Study on Overfitting in Deep Reinforcement Learning	Apr 18, 2018	Deep Reinforcement LearningInductive Bias	CodeCode Available	0
Automated vehicle's behavior decision making using deep reinforcement learning and high-fidelity simulation environment	Apr 17, 2018	Decision MakingDeep Reinforcement Learning	—Unverified	0
Model-Free Linear Quadratic Control via Reduction to Expert Prediction	Apr 17, 2018	continuous-controlContinuous Control	—Unverified	0
On Improving Deep Reinforcement Learning for POMDPs	Apr 17, 2018	Atari GamesDecision Making	—Unverified	0
State-Augmentation Transformations for Risk-Sensitive Reinforcement Learning	Apr 16, 2018	Q-Learningreinforcement-learning	—Unverified	0
Learning How to Self-Learn: Enhancing Self-Training Using Neural Reinforcement Learning	Apr 16, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
CytonRL: an Efficient Reinforcement Learning Open-source Toolkit Implemented in C++	Apr 14, 2018	GPUQ-Learning	CodeCode Available	0
Robust Dual View Deep Agent	Apr 13, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Optimizing Query Evaluations using Reinforcement Learning for Web Search	Apr 12, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Distort-and-Recover: Color Enhancement using Deep Reinforcement Learning	Apr 12, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Feature-Based Aggregation and Deep Reinforcement Learning: A Survey and Some New Implementations	Apr 12, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Emergence of Linguistic Communication from Referential Games with Symbolic and Pixel Input	Apr 11, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
DORA The Explorer: Directed Outreaching Reinforcement Action-Selection	Apr 11, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Universal Successor Representations for Transfer Reinforcement Learning	Apr 11, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Market Making via Reinforcement Learning	Apr 11, 2018	Positionreinforcement-learning	CodeCode Available	0
A clustering-based reinforcement learning approach for tailored personalization of e-Health interventions	Apr 10, 2018	ClusteringDynamic Time Warping	—Unverified	0
Crafting a Toolchain for Image Restoration by Deep Reinforcement Learning	Apr 10, 2018	Deep Reinforcement LearningImage Restoration	CodeCode Available	0
Binary Space Partitioning as Intrinsic Reward	Apr 10, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Outline Objects using Deep Reinforcement Learning	Apr 10, 2018	Deep Reinforcement LearningImage Segmentation	—Unverified	0
Gotta Learn Fast: A New Benchmark for Generalization in RL	Apr 10, 2018	Few-Shot Learningreinforcement-learning	CodeCode Available	0
Latent Space Policies for Hierarchical Reinforcement Learning	Apr 9, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Hierarchical Modular Reinforcement Learning Method and Knowledge Acquisition of State-Action Rule for Multi-target Problem	Apr 8, 2018	PositionQ-Learning	—Unverified	0
DeepMimic: Example-Guided Deep Reinforcement Learning of Physics-Based Character Skills	Apr 8, 2018	Deep Reinforcement LearningMotion Synthesis	CodeCode Available	1
Scalable Sentiment for Sequence-to-sequence Chatbot Response with Performance Analysis	Apr 7, 2018	Chatbotreinforcement-learning	—Unverified	0
End-to-End Learning of Communications Systems Without a Channel Model	Apr 6, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Programmatically Interpretable Reinforcement Learning	Apr 6, 2018	Car RacingDeep Reinforcement Learning	—Unverified	0
A Human Mixed Strategy Approach to Deep Reinforcement Learning	Apr 5, 2018	Atari GamesDeep Reinforcement Learning	—Unverified	0
Information Maximizing Exploration with a Latent Dynamics Model	Apr 4, 2018	continuous-controlContinuous Control	—Unverified	0
EmoRL: Continuous Acoustic Emotion Classification using Deep Reinforcement Learning	Apr 3, 2018	ClassificationDeep Reinforcement Learning	—Unverified	0
Renewal Monte Carlo: Renewal theory based reinforcement learning	Apr 3, 2018	Managementreinforcement-learning	—Unverified	0
StarCraft Micromanagement with Reinforcement Learning and Curriculum Transfer Learning	Apr 3, 2018	Real-Time Strategy Gamesreinforcement-learning	CodeCode Available	0
Recall Traces: Backtracking Models for Efficient Reinforcement Learning	Apr 2, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Learning to Run challenge solutions: Adapting reinforcement learning methods for neuromusculoskeletal environments	Apr 2, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Curiosity-driven Exploration for Mapless Navigation with Deep Reinforcement Learning	Apr 2, 2018	Deep Reinforcement LearningNavigate	—Unverified	0
Learning to Run challenge: Synthesizing physiologically accurate motion using deep reinforcement learning	Mar 31, 2018	Deep Reinforcement LearningNavigate	—Unverified	0
Snap Angle Prediction for 360^ Panoramas	Mar 31, 2018	Predictionreinforcement-learning	—Unverified	0
Towards Learning Transferable Conversational Skills using Multi-dimensional Dialogue Modelling	Mar 31, 2018	Dialogue ManagementDomain Adaptation	CodeCode Available	0
Learning to Navigate in Cities Without a Map	Mar 31, 2018	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available	0
Learning to Adapt in Dynamic, Real-World Environments Through Meta-Reinforcement Learning	Mar 30, 2018	continuous-controlContinuous Control	CodeCode Available	1
QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning	Mar 30, 2018	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
How an Electrical Engineer Became an Artificial Intelligence Researcher, a Multiphase Active Contours Analysis	Mar 29, 2018	Electrical EngineeringInterpretable Machine Learning	—Unverified	0
Deep Reinforcement Learning for Traffic Light Control in Vehicular Networks	Mar 29, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available	0
Unsupervised Predictive Memory in a Goal-Directed Agent	Mar 28, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Reinforcement learning for non-prehensile manipulation: Transfer from simulation to physical system	Mar 28, 2018	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning for Fair Dynamic Pricing	Mar 27, 2018	Fairnessreinforcement-learning	—Unverified	0
Forward-Backward Reinforcement Learning	Mar 27, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Synergies between Pushing and Grasping with Self-supervised Deep Reinforcement Learning	Mar 27, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 277 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified