Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13901–13950 of 15113 papers

Title	Date	Tasks	Status	Hype
Reinforcement Learning to Rank in E-Commerce Search Engine: Formalization, Analysis, and Application	Mar 2, 2018	Decision MakingLearning-To-Rank	CodeCode Available	0
Towards Cooperation in Sequential Prisoner's Dilemmas: a Deep Multiagent Reinforcement Learning Approach	Mar 1, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Inverse Reinforcement Learning via Nonparametric Spatio-Temporal Subgoal Modeling	Mar 1, 2018	Active Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Sponsored Search Real-time Bidding	Mar 1, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
On Oracle-Efficient PAC RL with Rich Observations	Mar 1, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Hierarchical Imitation and Reinforcement Learning	Mar 1, 2018	Decision MakingImitation Learning	—Unverified	0
Learning by Playing - Solving Sparse Reward Tasks from Scratch	Feb 28, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Model-Ensemble Trust-Region Policy Optimization	Feb 28, 2018	continuous-controlContinuous Control	CodeCode Available	0
Model-Based Value Estimation for Efficient Model-Free Reinforcement Learning	Feb 28, 2018	continuous-controlContinuous Control	—Unverified	0
Deep Reinforcement Learning for Join Order Enumeration	Feb 28, 2018	Decision MakingDeep Reinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Vision-Based Robotic Grasping: A Simulated Comparative Evaluation of Off-Policy Methods	Feb 28, 2018	Deep Reinforcement LearningDiversity	CodeCode Available	0
DiGrad: Multi-Task Reinforcement Learning with Shared Actions	Feb 27, 2018	Multi-Task Learningreinforcement-learning	—Unverified	0
Real-Time Bidding with Multi-Agent Reinforcement Learning in Display Advertising	Feb 27, 2018	ClusteringMulti-agent Reinforcement Learning	—Unverified	0
The Mirage of Action-Dependent Baselines in Reinforcement Learning	Feb 27, 2018	Policy Gradient Methodsreinforcement-learning	CodeCode Available	0
Deep Bayesian Bandits Showdown: An Empirical Comparison of Bayesian Deep Networks for Thompson Sampling	Feb 26, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Multi-Goal Reinforcement Learning: Challenging Robotics Environments and Request for Research	Feb 26, 2018	continuous-controlContinuous Control	CodeCode Available	0
Modeling Others using Oneself in Multi-Agent Reinforcement Learning	Feb 26, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Variance Reduction Methods for Sublinear Reinforcement Learning	Feb 26, 2018	Q-Learningreinforcement-learning	—Unverified	0
Reinforcement and Imitation Learning for Diverse Visuomotor Skills	Feb 26, 2018	Deep Reinforcement LearningImitation Learning	CodeCode Available	0
Addressing Function Approximation Error in Actor-Critic Methods	Feb 26, 2018	Continuous ControlOpenAI Gym	CodeCode Available	1
Temporal Difference Models: Model-Free Deep RL for Model-Based Control	Feb 25, 2018	continuous-controlContinuous Control	—Unverified	0
Reinforcement Learning on Web Interfaces Using Workflow-Guided Exploration	Feb 24, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	1
Back to Basics: Benchmarking Canonical Evolution Strategies for Playing Atari	Feb 24, 2018	Atari GamesBenchmarking	CodeCode Available	0
Fully Decentralized Multi-Agent Reinforcement Learning with Networked Agents	Feb 23, 2018	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Budget Constrained Bidding by Model-free Reinforcement Learning in Display Advertising	Feb 23, 2018	Marketingreinforcement-learning	—Unverified	0
Verifying Controllers Against Adversarial Examples with Bayesian Optimization	Feb 23, 2018	Bayesian Optimizationreinforcement-learning	CodeCode Available	0
Weighted Double Deep Multiagent Reinforcement Learning in Stochastic Cooperative Environments	Feb 23, 2018	Deep Reinforcement LearningQ-Learning	—Unverified	0
Ranking Sentences for Extractive Summarization with Reinforcement Learning	Feb 23, 2018	Document SummarizationExtractive Summarization	CodeCode Available	0
Structured Control Nets for Deep Reinforcement Learning	Feb 22, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
An Analysis of Categorical Distributional Reinforcement Learning	Feb 22, 2018	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Diverse Exploration for Fast and Safe Policy Improvement	Feb 22, 2018	Diversityreinforcement-learning	—Unverified	0
Variational Inference for Policy Gradient	Feb 21, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Meta-Reinforcement Learning of Structured Exploration Strategies	Feb 20, 2018	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1
Continual Reinforcement Learning with Complex Synapses	Feb 20, 2018	Continual LearningDeep Reinforcement Learning	—Unverified	0
Accelerated Primal-Dual Policy Optimization for Safe Reinforcement Learning	Feb 19, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Fourier Policy Gradients	Feb 19, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Recommendations with Negative Feedback via Pairwise Deep Reinforcement Learning	Feb 19, 2018	Deep Reinforcement LearningRecommendation Systems	—Unverified	0
Improving Mild Cognitive Impairment Prediction via Reinforcement Learning and Dialogue Simulation	Feb 18, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Estimating scale-invariant future in continuous time	Feb 18, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Efficient Collaborative Multi-Agent Deep Reinforcement Learning for Large-Scale Fleet Management	Feb 18, 2018	Deep Reinforcement LearningManagement	CodeCode Available	0
Bridging Cognitive Programs and Machine Learning	Feb 16, 2018	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Modeling the Formation of Social Conventions from Embodied Real-Time Interactions	Feb 16, 2018	Decision MakingFairness	—Unverified	0
Reactive Reinforcement Learning in Asynchronous Environments	Feb 16, 2018	Decision Makingreinforcement-learning	—Unverified	0
Monte Carlo Q-learning for General Game Playing	Feb 16, 2018	Board GamesQ-Learning	CodeCode Available	0
Diversity is All You Need: Learning Skills without a Reward Function	Feb 16, 2018	AllDiversity	CodeCode Available	1
Prioritized Sweeping Neural DynaQ with Multiple Predecessors, and Hippocampal Replays	Feb 15, 2018	HippocampusQ-Learning	—Unverified	0
Mean Field Multi-Agent Reinforcement Learning	Feb 15, 2018	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	1
Reinforcement Learning from Imperfect Demonstrations	Feb 14, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
From Gameplay to Symbolic Reasoning: Learning SAT Solver Heuristics in the Style of Alpha(Go) Zero	Feb 14, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms	Feb 14, 2018	Deep Reinforcement LearningDiversity	CodeCode Available	0

Show:10 25 50

← PrevPage 279 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified