Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13951–14000 of 15113 papers

Title	Date	Tasks	Status
Setting up a Reinforcement Learning Task with a Real-World Robot	Mar 19, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Composable Deep Reinforcement Learning for Robotic Manipulation	Mar 19, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available
Automated Curriculum Learning by Rewarding Temporally Rare Events	Mar 19, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Neural Text Generation: Past, Present and Beyond	Mar 15, 2018	BenchmarkingDiversity	—Unverified
Rearrangement with Nonprehensile Manipulation Using Deep Reinforcement Learning	Mar 15, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Measurement-based adaptation protocol with quantum reinforcement learning	Mar 14, 2018	reinforcement-learningReinforcement Learning	—Unverified
Automated Speed and Lane Change Decision Making using Deep Reinforcement Learning	Mar 14, 2018	Decision MakingDeep Reinforcement Learning	—Unverified
Imitation Learning with Concurrent Actions in 3D Games	Mar 14, 2018	Deep Reinforcement LearningImitation Learning	—Unverified
Hierarchical Reinforcement Learning: Approximating Optimal Discounted TSP Using Local Policies	Mar 13, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Learning to Explore with Meta-Policy Gradient	Mar 13, 2018	Q-LearningReinforcement Learning	—Unverified
Active Reinforcement Learning with Monte-Carlo Tree Search	Mar 13, 2018	reinforcement-learningReinforcement Learning	—Unverified
Policy Search in Continuous Action Domains: an Overview	Mar 13, 2018	Bayesian OptimizationDeep Reinforcement Learning	—Unverified
Soft-Robust Actor-Critic Policy-Gradient	Mar 11, 2018	reinforcement-learningReinforcement Learning	—Unverified
Deep reinforcement learning for time series: playing idealized trading games	Mar 11, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available
Kickstarting Deep Reinforcement Learning	Mar 10, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Variance Networks: When Expectation Does Not Meet Your Expectations	Mar 10, 2018	Efficient ExplorationReinforcement Learning	CodeCode Available
SA-IGA: A Multiagent Reinforcement Learning Method Towards Socially Optimal Outcomes	Mar 8, 2018	Q-Learningreinforcement-learning	—Unverified
DeepCAS: A Deep Reinforcement Learning Algorithm for Control-Aware Scheduling	Mar 8, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Feudal Reinforcement Learning for Dialogue Management in Large Domains	Mar 8, 2018	Dialogue ManagementManagement	—Unverified
A Multi-Objective Deep Reinforcement Learning Framework	Mar 8, 2018	Deep Reinforcement LearningMulti-Objective Reinforcement Learning	—Unverified
A Brandom-ian view of Reinforcement Learning towards strong-AI	Mar 7, 2018	Philosophyreinforcement-learning	—Unverified
Extracting Action Sequences from Texts Based on Deep Reinforcement Learning	Mar 7, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Intent-aware Multi-agent Reinforcement Learning	Mar 6, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Personalized Exposure Control Using Adaptive Metering and Reinforcement Learning	Mar 6, 2018	reinforcement-learningReinforcement Learning	—Unverified
Smoothed Action Value Functions for Learning Gaussian Policies	Mar 6, 2018	continuous-controlContinuous Control	—Unverified
Synthesizing Neural Network Controllers with Probabilistic Model based Reinforcement Learning	Mar 6, 2018	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Variance-Aware Regret Bounds for Undiscounted Reinforcement Learning in MDPs	Mar 5, 2018	LEMMAreinforcement-learning	—Unverified
OIL: Observational Imitation Learning	Mar 3, 2018	Autonomous DrivingAutonomous Navigation	—Unverified
Some Considerations on Learning to Explore via Meta-Reinforcement Learning	Mar 3, 2018	Meta Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforcement Learning to Rank in E-Commerce Search Engine: Formalization, Analysis, and Application	Mar 2, 2018	Decision MakingLearning-To-Rank	CodeCode Available
Model-Free Control for Distributed Stream Data Processing using Deep Reinforcement Learning	Mar 2, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Towards Cooperation in Sequential Prisoner's Dilemmas: a Deep Multiagent Reinforcement Learning Approach	Mar 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
On Oracle-Efficient PAC RL with Rich Observations	Mar 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Inverse Reinforcement Learning via Nonparametric Spatio-Temporal Subgoal Modeling	Mar 1, 2018	Active Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Sponsored Search Real-time Bidding	Mar 1, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hierarchical Imitation and Reinforcement Learning	Mar 1, 2018	Decision MakingImitation Learning	—Unverified
Deep Reinforcement Learning for Join Order Enumeration	Feb 28, 2018	Decision MakingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Vision-Based Robotic Grasping: A Simulated Comparative Evaluation of Off-Policy Methods	Feb 28, 2018	Deep Reinforcement LearningDiversity	CodeCode Available
Learning by Playing - Solving Sparse Reward Tasks from Scratch	Feb 28, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Model-Ensemble Trust-Region Policy Optimization	Feb 28, 2018	continuous-controlContinuous Control	CodeCode Available
Model-Based Value Estimation for Efficient Model-Free Reinforcement Learning	Feb 28, 2018	continuous-controlContinuous Control	—Unverified
Real-Time Bidding with Multi-Agent Reinforcement Learning in Display Advertising	Feb 27, 2018	ClusteringMulti-agent Reinforcement Learning	—Unverified
The Mirage of Action-Dependent Baselines in Reinforcement Learning	Feb 27, 2018	Policy Gradient Methodsreinforcement-learning	CodeCode Available
DiGrad: Multi-Task Reinforcement Learning with Shared Actions	Feb 27, 2018	Multi-Task Learningreinforcement-learning	—Unverified
Deep Bayesian Bandits Showdown: An Empirical Comparison of Bayesian Deep Networks for Thompson Sampling	Feb 26, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available
Modeling Others using Oneself in Multi-Agent Reinforcement Learning	Feb 26, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Multi-Goal Reinforcement Learning: Challenging Robotics Environments and Request for Research	Feb 26, 2018	continuous-controlContinuous Control	CodeCode Available
Variance Reduction Methods for Sublinear Reinforcement Learning	Feb 26, 2018	Q-Learningreinforcement-learning	—Unverified
Reinforcement and Imitation Learning for Diverse Visuomotor Skills	Feb 26, 2018	Deep Reinforcement LearningImitation Learning	CodeCode Available
Temporal Difference Models: Model-Free Deep RL for Model-Based Control	Feb 25, 2018	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 280 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified