Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13851–13900 of 15113 papers

Title	Date	Tasks	Status	Hype
Deep Communicating Agents for Abstractive Summarization	Mar 27, 2018	Abstractive Text SummarizationDecoder	—Unverified	0
World Models	Mar 27, 2018	Car Racingreinforcement-learning	CodeCode Available	1
Scalable photonic reinforcement learning by time-division multiplexing of laser chaos	Mar 26, 2018	Decision Makingreinforcement-learning	—Unverified	0
Autonomous Ramp Merge Maneuver Based on Reinforcement Learning with Continuous Action Space	Mar 25, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
The Importance of Constraint Smoothness for Parameter Estimation in Computational Cognitive Modeling	Mar 24, 2018	Decision Makingparameter estimation	—Unverified	0
Accelerating Learning in Constructive Predictive Frameworks with the Successor Representation	Mar 23, 2018	Continual LearningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning with Model Learning and Monte Carlo Tree Search in Minecraft	Mar 22, 2018	Deep Reinforcement LearningMinecraft	—Unverified	0
DOP: Deep Optimistic Planning with Approximate Value Function Evaluation	Mar 22, 2018	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Learning State Representations for Query Optimization with Deep Reinforcement Learning	Mar 22, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Neuronal Circuit Policies	Mar 22, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Look Before You Leap: Bridging Model-Free and Model-Based Reinforcement Learning for Planned-Ahead Vision-and-Language Navigation	Mar 21, 2018	Deep Reinforcement Learningmodel	CodeCode Available	0
End-to-End Video Captioning with Multitask Reinforcement Learning	Mar 21, 2018	GPUreinforcement-learning	CodeCode Available	0
Learning Robotic Assembly from CAD	Mar 20, 2018	Contact-rich ManipulationMotion Planning	—Unverified	0
Variance Reduction for Policy Gradient with Action-Dependent Factorized Baselines	Mar 20, 2018	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Natural Gradient Deep Q-learning	Mar 20, 2018	Deep Reinforcement LearningHyperparameter Optimization	—Unverified	0
Meta Reinforcement Learning with Latent Variable Gaussian Processes	Mar 20, 2018	Drug DesignGaussian Processes	—Unverified	0
Optimizing Sponsored Search Ranking Strategy by Deep Reinforcement Learning	Mar 20, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Composable Deep Reinforcement Learning for Robotic Manipulation	Mar 19, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available	0
Simple random search provides a competitive approach to reinforcement learning	Mar 19, 2018	Computational Efficiencycontinuous-control	CodeCode Available	1
Setting up a Reinforcement Learning Task with a Real-World Robot	Mar 19, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Automated Curriculum Learning by Rewarding Temporally Rare Events	Mar 19, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Rearrangement with Nonprehensile Manipulation Using Deep Reinforcement Learning	Mar 15, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Neural Text Generation: Past, Present and Beyond	Mar 15, 2018	BenchmarkingDiversity	—Unverified	0
Measurement-based adaptation protocol with quantum reinforcement learning	Mar 14, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Automated Speed and Lane Change Decision Making using Deep Reinforcement Learning	Mar 14, 2018	Decision MakingDeep Reinforcement Learning	—Unverified	0
Imitation Learning with Concurrent Actions in 3D Games	Mar 14, 2018	Deep Reinforcement LearningImitation Learning	—Unverified	0
Hierarchical Reinforcement Learning: Approximating Optimal Discounted TSP Using Local Policies	Mar 13, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Learning to Explore with Meta-Policy Gradient	Mar 13, 2018	Q-LearningReinforcement Learning	—Unverified	0
Active Reinforcement Learning with Monte-Carlo Tree Search	Mar 13, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Policy Search in Continuous Action Domains: an Overview	Mar 13, 2018	Bayesian OptimizationDeep Reinforcement Learning	—Unverified	0
Soft-Robust Actor-Critic Policy-Gradient	Mar 11, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Deep reinforcement learning for time series: playing idealized trading games	Mar 11, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available	0
Kickstarting Deep Reinforcement Learning	Mar 10, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Variance Networks: When Expectation Does Not Meet Your Expectations	Mar 10, 2018	Efficient ExplorationReinforcement Learning	CodeCode Available	0
SA-IGA: A Multiagent Reinforcement Learning Method Towards Socially Optimal Outcomes	Mar 8, 2018	Q-Learningreinforcement-learning	—Unverified	0
Feudal Reinforcement Learning for Dialogue Management in Large Domains	Mar 8, 2018	Dialogue ManagementManagement	—Unverified	0
A Multi-Objective Deep Reinforcement Learning Framework	Mar 8, 2018	Deep Reinforcement LearningMulti-Objective Reinforcement Learning	—Unverified	0
DeepCAS: A Deep Reinforcement Learning Algorithm for Control-Aware Scheduling	Mar 8, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Brandom-ian view of Reinforcement Learning towards strong-AI	Mar 7, 2018	Philosophyreinforcement-learning	—Unverified	0
Accelerated Methods for Deep Reinforcement Learning	Mar 7, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available	2
Extracting Action Sequences from Texts Based on Deep Reinforcement Learning	Mar 7, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Intent-aware Multi-agent Reinforcement Learning	Mar 6, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Personalized Exposure Control Using Adaptive Metering and Reinforcement Learning	Mar 6, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Synthesizing Neural Network Controllers with Probabilistic Model based Reinforcement Learning	Mar 6, 2018	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	0
Smoothed Action Value Functions for Learning Gaussian Policies	Mar 6, 2018	continuous-controlContinuous Control	—Unverified	0
Variance-Aware Regret Bounds for Undiscounted Reinforcement Learning in MDPs	Mar 5, 2018	LEMMAreinforcement-learning	—Unverified	0
OIL: Observational Imitation Learning	Mar 3, 2018	Autonomous DrivingAutonomous Navigation	—Unverified	0
Some Considerations on Learning to Explore via Meta-Reinforcement Learning	Mar 3, 2018	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	0
Model-Free Control for Distributed Stream Data Processing using Deep Reinforcement Learning	Mar 2, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Distributed Prioritized Experience Replay	Mar 2, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available	3

Show:10 25 50

← PrevPage 278 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified