Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13901–13950 of 15113 papers

Title	Date	Tasks	Status
Feature-Based Aggregation and Deep Reinforcement Learning: A Survey and Some New Implementations	Apr 12, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Distort-and-Recover: Color Enhancement using Deep Reinforcement Learning	Apr 12, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
DORA The Explorer: Directed Outreaching Reinforcement Action-Selection	Apr 11, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Emergence of Linguistic Communication from Referential Games with Symbolic and Pixel Input	Apr 11, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Market Making via Reinforcement Learning	Apr 11, 2018	Positionreinforcement-learning	CodeCode Available
Universal Successor Representations for Transfer Reinforcement Learning	Apr 11, 2018	reinforcement-learningReinforcement Learning	—Unverified
A clustering-based reinforcement learning approach for tailored personalization of e-Health interventions	Apr 10, 2018	ClusteringDynamic Time Warping	—Unverified
Outline Objects using Deep Reinforcement Learning	Apr 10, 2018	Deep Reinforcement LearningImage Segmentation	—Unverified
Binary Space Partitioning as Intrinsic Reward	Apr 10, 2018	reinforcement-learningReinforcement Learning	—Unverified
Crafting a Toolchain for Image Restoration by Deep Reinforcement Learning	Apr 10, 2018	Deep Reinforcement LearningImage Restoration	CodeCode Available
Gotta Learn Fast: A New Benchmark for Generalization in RL	Apr 10, 2018	Few-Shot Learningreinforcement-learning	CodeCode Available
Latent Space Policies for Hierarchical Reinforcement Learning	Apr 9, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Hierarchical Modular Reinforcement Learning Method and Knowledge Acquisition of State-Action Rule for Multi-target Problem	Apr 8, 2018	PositionQ-Learning	—Unverified
Scalable Sentiment for Sequence-to-sequence Chatbot Response with Performance Analysis	Apr 7, 2018	Chatbotreinforcement-learning	—Unverified
Programmatically Interpretable Reinforcement Learning	Apr 6, 2018	Car RacingDeep Reinforcement Learning	—Unverified
End-to-End Learning of Communications Systems Without a Channel Model	Apr 6, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
A Human Mixed Strategy Approach to Deep Reinforcement Learning	Apr 5, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Information Maximizing Exploration with a Latent Dynamics Model	Apr 4, 2018	continuous-controlContinuous Control	—Unverified
EmoRL: Continuous Acoustic Emotion Classification using Deep Reinforcement Learning	Apr 3, 2018	ClassificationDeep Reinforcement Learning	—Unverified
StarCraft Micromanagement with Reinforcement Learning and Curriculum Transfer Learning	Apr 3, 2018	Real-Time Strategy Gamesreinforcement-learning	CodeCode Available
Renewal Monte Carlo: Renewal theory based reinforcement learning	Apr 3, 2018	Managementreinforcement-learning	—Unverified
Recall Traces: Backtracking Models for Efficient Reinforcement Learning	Apr 2, 2018	reinforcement-learningReinforcement Learning	—Unverified
Curiosity-driven Exploration for Mapless Navigation with Deep Reinforcement Learning	Apr 2, 2018	Deep Reinforcement LearningNavigate	—Unverified
Learning to Run challenge solutions: Adapting reinforcement learning methods for neuromusculoskeletal environments	Apr 2, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Learning to Run challenge: Synthesizing physiologically accurate motion using deep reinforcement learning	Mar 31, 2018	Deep Reinforcement LearningNavigate	—Unverified
Learning to Navigate in Cities Without a Map	Mar 31, 2018	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available
Snap Angle Prediction for 360^ Panoramas	Mar 31, 2018	Predictionreinforcement-learning	—Unverified
Towards Learning Transferable Conversational Skills using Multi-dimensional Dialogue Modelling	Mar 31, 2018	Dialogue ManagementDomain Adaptation	CodeCode Available
Deep Reinforcement Learning for Traffic Light Control in Vehicular Networks	Mar 29, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available
How an Electrical Engineer Became an Artificial Intelligence Researcher, a Multiphase Active Contours Analysis	Mar 29, 2018	Electrical EngineeringInterpretable Machine Learning	—Unverified
Unsupervised Predictive Memory in a Goal-Directed Agent	Mar 28, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Reinforcement learning for non-prehensile manipulation: Transfer from simulation to physical system	Mar 28, 2018	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for Fair Dynamic Pricing	Mar 27, 2018	Fairnessreinforcement-learning	—Unverified
Deep Communicating Agents for Abstractive Summarization	Mar 27, 2018	Abstractive Text SummarizationDecoder	—Unverified
Forward-Backward Reinforcement Learning	Mar 27, 2018	reinforcement-learningReinforcement Learning	—Unverified
Scalable photonic reinforcement learning by time-division multiplexing of laser chaos	Mar 26, 2018	Decision Makingreinforcement-learning	—Unverified
Autonomous Ramp Merge Maneuver Based on Reinforcement Learning with Continuous Action Space	Mar 25, 2018	reinforcement-learningReinforcement Learning	—Unverified
The Importance of Constraint Smoothness for Parameter Estimation in Computational Cognitive Modeling	Mar 24, 2018	Decision Makingparameter estimation	—Unverified
Accelerating Learning in Constructive Predictive Frameworks with the Successor Representation	Mar 23, 2018	Continual LearningReinforcement Learning	—Unverified
DOP: Deep Optimistic Planning with Approximate Value Function Evaluation	Mar 22, 2018	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Learning State Representations for Query Optimization with Deep Reinforcement Learning	Mar 22, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning with Model Learning and Monte Carlo Tree Search in Minecraft	Mar 22, 2018	Deep Reinforcement LearningMinecraft	—Unverified
Neuronal Circuit Policies	Mar 22, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Look Before You Leap: Bridging Model-Free and Model-Based Reinforcement Learning for Planned-Ahead Vision-and-Language Navigation	Mar 21, 2018	Deep Reinforcement Learningmodel	CodeCode Available
End-to-End Video Captioning with Multitask Reinforcement Learning	Mar 21, 2018	GPUreinforcement-learning	CodeCode Available
Learning Robotic Assembly from CAD	Mar 20, 2018	Contact-rich ManipulationMotion Planning	—Unverified
Meta Reinforcement Learning with Latent Variable Gaussian Processes	Mar 20, 2018	Drug DesignGaussian Processes	—Unverified
Variance Reduction for Policy Gradient with Action-Dependent Factorized Baselines	Mar 20, 2018	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Optimizing Sponsored Search Ranking Strategy by Deep Reinforcement Learning	Mar 20, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Natural Gradient Deep Q-learning	Mar 20, 2018	Deep Reinforcement LearningHyperparameter Optimization	—Unverified

Show:10 25 50

← PrevPage 279 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified