Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13651–13700 of 15113 papers

Title	Date	Tasks	Status
Goal-oriented Trajectories for Efficient Exploration	Jul 5, 2018	Efficient Explorationreinforcement-learning	—Unverified
Using Reinforcement Learning with Partial Vehicle Detection for Intelligent Traffic Signal Control	Jul 4, 2018	reinforcement-learningReinforcement Learning	—Unverified
Supervised Reinforcement Learning with Recurrent Neural Network for Dynamic Treatment Recommendation	Jul 4, 2018	Recommendation Systemsreinforcement-learning	—Unverified
Region Growing Curriculum Generation for Reinforcement Learning	Jul 4, 2018	reinforcement-learningReinforcement Learning	—Unverified
Sample-Efficient Reinforcement Learning with Stochastic Ensemble Value Expansion	Jul 4, 2018	continuous-controlContinuous Control	—Unverified
Transfer with Model Features in Reinforcement Learning	Jul 4, 2018	modelreinforcement-learning	—Unverified
Ranked Reward: Enabling Self-Play Reinforcement Learning for Combinatorial Optimization	Jul 4, 2018	Combinatorial Optimizationreinforcement-learning	CodeCode Available
Human-level performance in first-person multiplayer games with population-based deep reinforcement learning	Jul 3, 2018	Deep Reinforcement LearningReinforcement Learning	—Unverified
Learning Goal-Oriented Visual Dialog via Tempered Policy Gradient	Jul 2, 2018	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Feudal Dialogue Management with Jointly Learned Feature Extractors	Jul 1, 2018	Dialogue ManagementManagement	—Unverified
Deep Reinforcement Learning in Continuous Action Spaces: a Case Study in the Game of Simulated Curling	Jul 1, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
A Language Model based Evaluator for Sentence Compression	Jul 1, 2018	Language ModelingLanguage Modelling	—Unverified
Learning to Act in Decentralized Partially Observable MDPs	Jul 1, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Accurate Uncertainties for Deep Learning Using Calibrated Regression	Jul 1, 2018	Deep LearningModel-based Reinforcement Learning	CodeCode Available
Learning to Drive in a Day	Jul 1, 2018	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available
Beyond the One-Step Greedy Approach in Reinforcement Learning	Jul 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning to Explore via Meta-Policy Gradient	Jul 1, 2018	continuous-controlContinuous Control	—Unverified
Deep Reinforcement Learning for NLP	Jul 1, 2018	Atari Gamescoreference-resolution	—Unverified
Beyond Winning and Losing: Modeling Human Motivations and Behaviors Using Inverse Reinforcement Learning	Jul 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Reinforcement Learning Neural Network for Robotic Manipulator Control	Jul 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning How to Actively Learn: A Deep Imitation Learning Approach	Jul 1, 2018	Active LearningGeneral Classification	CodeCode Available
Learning Hierarchical Structures On-The-Fly with a Recurrent-Recursive Model for Sequences	Jul 1, 2018	Language ModelingLanguage Modelling	—Unverified
Mix & Match - Agent Curricula for Reinforcement Learning	Jul 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Sequicity: Simplifying Task-oriented Dialogue Systems with Single Sequence-to-Sequence Architectures	Jul 1, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Spotlight: Optimizing Device Placement for Training Deep Neural Networks	Jul 1, 2018	CPUGPU	—Unverified
State Abstractions for Lifelong Reinforcement Learning	Jul 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Policy and Value Transfer in Lifelong Reinforcement Learning	Jul 1, 2018	Lifelong learningreinforcement-learning	—Unverified
Towards Mixed Optimization for Reinforcement Learning with Program Synthesis	Jul 1, 2018	Deep Reinforcement LearningProgram Repair	—Unverified
Policy Optimization with Demonstrations	Jul 1, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified
Understanding and Simplifying One-Shot Architecture Search	Jul 1, 2018	Neural Architecture Searchreinforcement-learning	—Unverified
Using Reward Machines for High-Level Task Specification and Decomposition in Reinforcement Learning	Jul 1, 2018	Hierarchical Reinforcement LearningQ-Learning	CodeCode Available
Hierarchical Reinforcement Learning with Abductive Planning	Jun 28, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Illuminating Generalization in Deep Reinforcement Learning through Procedural Level Generation	Jun 28, 2018	ClusteringDeep Reinforcement Learning	CodeCode Available
MONAS: Multi-Objective Neural Architecture Search using Reinforcement Learning	Jun 27, 2018	General ClassificationNeural Architecture Search	—Unverified
QT-Opt: Scalable Deep Reinforcement Learning for Vision-Based Robotic Manipulation	Jun 27, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Multi-agent Inverse Reinforcement Learning for Certain General-sum Stochastic Games	Jun 26, 2018	reinforcement-learningReinforcement Learning	—Unverified
Deep Generative Models with Learnable Knowledge Constraints	Jun 26, 2018	Image GenerationReinforcement Learning	—Unverified
A Tour of Reinforcement Learning: The View from Continuous Control	Jun 25, 2018	continuous-controlContinuous Control	CodeCode Available
Accuracy-based Curriculum Learning in Deep Reinforcement Learning	Jun 25, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Deep Reinforcement Learning: An Overview	Jun 23, 2018	BIG-bench Machine LearningDeep Learning	—Unverified
Human-Interactive Subgoal Supervision for Efficient Inverse Reinforcement Learning	Jun 22, 2018	reinforcement-learningReinforcement Learning	—Unverified
Many-Goals Reinforcement Learning	Jun 22, 2018	AllQ-Learning	—Unverified
A New Approach for Resource Scheduling with Deep Reinforcement Learning	Jun 21, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
How Many Random Seeds? Statistical Power Analysis in Deep Reinforcement Learning Experiments	Jun 21, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Deep Reinforcement Learning for Surgical Gesture Segmentation and Classification	Jun 21, 2018	Action SegmentationClassification	CodeCode Available
A Dissection of Overfitting and Generalization in Continuous Reinforcement Learning	Jun 20, 2018	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Sim-to-Real Reinforcement Learning for Deformable Object Manipulation	Jun 20, 2018	Deep Reinforcement LearningDeformable Object Manipulation	CodeCode Available
Reinforcement Learning using Augmented Neural Networks	Jun 20, 2018	Q-Learningreinforcement-learning	—Unverified
Skilled Experience Catalogue: A Skill-Balancing Mechanism for Non-Player Characters using Reinforcement Learning	Jun 20, 2018	Decision Makingreinforcement-learning	—Unverified
RUDDER: Return Decomposition for Delayed Rewards	Jun 20, 2018	Atari Gamesreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 274 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified