Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13551–13600 of 15113 papers

Title	Date	Tasks	Status	Hype
End-to-End Race Driving with Deep Reinforcement Learning	Jul 6, 2018	Deep Reinforcement LearningDomain Adaptation	—Unverified	0
Variance Reduction for Reinforcement Learning in Input-Driven Environments	Jul 6, 2018	Meta-LearningMuJoCo	—Unverified	0
Deep Reinforcement Learning for Doom using Unsupervised Auxiliary Tasks	Jul 5, 2018	Atari GamesDeep Reinforcement Learning	—Unverified	0
Goal-oriented Trajectories for Efficient Exploration	Jul 5, 2018	Efficient Explorationreinforcement-learning	—Unverified	0
Arcades: A deep model for adaptive decision making in voice controlled smart-home	Jul 5, 2018	Decision MakingDeep Reinforcement Learning	—Unverified	0
Using Reinforcement Learning with Partial Vehicle Detection for Intelligent Traffic Signal Control	Jul 4, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Transfer with Model Features in Reinforcement Learning	Jul 4, 2018	modelreinforcement-learning	—Unverified	0
Ranked Reward: Enabling Self-Play Reinforcement Learning for Combinatorial Optimization	Jul 4, 2018	Combinatorial Optimizationreinforcement-learning	CodeCode Available	0
Sample-Efficient Reinforcement Learning with Stochastic Ensemble Value Expansion	Jul 4, 2018	continuous-controlContinuous Control	—Unverified	0
Supervised Reinforcement Learning with Recurrent Neural Network for Dynamic Treatment Recommendation	Jul 4, 2018	Recommendation Systemsreinforcement-learning	—Unverified	0
Region Growing Curriculum Generation for Reinforcement Learning	Jul 4, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Human-level performance in first-person multiplayer games with population-based deep reinforcement learning	Jul 3, 2018	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
Learning Goal-Oriented Visual Dialog via Tempered Policy Gradient	Jul 2, 2018	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available	0
A Reinforcement Learning Neural Network for Robotic Manipulator Control	Jul 1, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning in Continuous Action Spaces: a Case Study in the Game of Simulated Curling	Jul 1, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Learning to Act in Decentralized Partially Observable MDPs	Jul 1, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Beyond the One-Step Greedy Approach in Reinforcement Learning	Jul 1, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Learning to Explore via Meta-Policy Gradient	Jul 1, 2018	continuous-controlContinuous Control	—Unverified	0
Policy and Value Transfer in Lifelong Reinforcement Learning	Jul 1, 2018	Lifelong learningreinforcement-learning	—Unverified	0
Using Reward Machines for High-Level Task Specification and Decomposition in Reinforcement Learning	Jul 1, 2018	Hierarchical Reinforcement LearningQ-Learning	CodeCode Available	0
Policy Optimization with Demonstrations	Jul 1, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified	0
Mix & Match - Agent Curricula for Reinforcement Learning	Jul 1, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Understanding and Simplifying One-Shot Architecture Search	Jul 1, 2018	Neural Architecture Searchreinforcement-learning	—Unverified	0
Spotlight: Optimizing Device Placement for Training Deep Neural Networks	Jul 1, 2018	CPUGPU	—Unverified	0
State Abstractions for Lifelong Reinforcement Learning	Jul 1, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Feudal Dialogue Management with Jointly Learned Feature Extractors	Jul 1, 2018	Dialogue ManagementManagement	—Unverified	0
Learning Hierarchical Structures On-The-Fly with a Recurrent-Recursive Model for Sequences	Jul 1, 2018	Language ModelingLanguage Modelling	—Unverified	0
A Language Model based Evaluator for Sentence Compression	Jul 1, 2018	Language ModelingLanguage Modelling	—Unverified	0
Learning How to Actively Learn: A Deep Imitation Learning Approach	Jul 1, 2018	Active LearningGeneral Classification	CodeCode Available	0
Deep Reinforcement Learning for NLP	Jul 1, 2018	Atari Gamescoreference-resolution	—Unverified	0
Sequicity: Simplifying Task-oriented Dialogue Systems with Single Sequence-to-Sequence Architectures	Jul 1, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Towards Mixed Optimization for Reinforcement Learning with Program Synthesis	Jul 1, 2018	Deep Reinforcement LearningProgram Repair	—Unverified	0
Learning to Drive in a Day	Jul 1, 2018	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available	0
Accurate Uncertainties for Deep Learning Using Calibrated Regression	Jul 1, 2018	Deep LearningModel-based Reinforcement Learning	CodeCode Available	0
Beyond Winning and Losing: Modeling Human Motivations and Behaviors Using Inverse Reinforcement Learning	Jul 1, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Hierarchical Reinforcement Learning with Abductive Planning	Jun 28, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Illuminating Generalization in Deep Reinforcement Learning through Procedural Level Generation	Jun 28, 2018	ClusteringDeep Reinforcement Learning	CodeCode Available	0
QT-Opt: Scalable Deep Reinforcement Learning for Vision-Based Robotic Manipulation	Jun 27, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
MONAS: Multi-Objective Neural Architecture Search using Reinforcement Learning	Jun 27, 2018	General ClassificationNeural Architecture Search	—Unverified	0
Multi-agent Inverse Reinforcement Learning for Certain General-sum Stochastic Games	Jun 26, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Generative Models with Learnable Knowledge Constraints	Jun 26, 2018	Image GenerationReinforcement Learning	—Unverified	0
Accuracy-based Curriculum Learning in Deep Reinforcement Learning	Jun 25, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
A Tour of Reinforcement Learning: The View from Continuous Control	Jun 25, 2018	continuous-controlContinuous Control	CodeCode Available	0
DARTS: Differentiable Architecture Search	Jun 24, 2018	General Classificationimage-classification	CodeCode Available	1
Deep Reinforcement Learning: An Overview	Jun 23, 2018	BIG-bench Machine LearningDeep Learning	—Unverified	0
Many-Goals Reinforcement Learning	Jun 22, 2018	AllQ-Learning	—Unverified	0
Human-Interactive Subgoal Supervision for Efficient Inverse Reinforcement Learning	Jun 22, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
A New Approach for Resource Scheduling with Deep Reinforcement Learning	Jun 21, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Surgical Gesture Segmentation and Classification	Jun 21, 2018	Action SegmentationClassification	CodeCode Available	0
How Many Random Seeds? Statistical Power Analysis in Deep Reinforcement Learning Experiments	Jun 21, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0

Show:10 25 50

← PrevPage 272 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified