Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10526–10550 of 15113 papers

Title	Date	Tasks	Status
Batch Value-function Approximation with Only Realizability	Aug 11, 2020	Model SelectionReinforcement Learning (RL)	CodeCode Available
Deep Model-Based Reinforcement Learning for High-Dimensional Problems, a Survey	Aug 11, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
GRIMGEP: Learning Progress for Robust Goal Sampling in Visual Deep Reinforcement Learning	Aug 10, 2020	Deep Reinforcement LearningDiversity	—Unverified
Deep Reinforcement Learning with Label Embedding Reward for Supervised Image Hashing	Aug 10, 2020	BinarizationDecision Making	—Unverified
Fault-Tolerant Control of Degrading Systems with On-Policy Reinforcement Learning	Aug 10, 2020	Fault Detectionreinforcement-learning	—Unverified
Comparison of Model Predictive and Reinforcement Learning Methods for Fault Tolerant Control	Aug 10, 2020	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Hierarchical Reinforcement Learning in StarCraft II with Human Expertise in Subgoals Selection	Aug 8, 2020	Decision MakingHierarchical Reinforcement Learning	—Unverified
Distributed Deep Reinforcement Learning for Functional Split Control in Energy Harvesting Virtualized Small Cells	Aug 7, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
A Machine of Few Words -- Interactive Speaker Recognition with Reinforcement Learning	Aug 7, 2020	Decision Makingreinforcement-learning	—Unverified
Incremental Text to Speech for Neural Sequence-to-Sequence Models using Reinforcement Learning	Aug 7, 2020	Audio Generationreinforcement-learning	—Unverified
Towards Sample Efficient Agents through Algorithmic Alignment	Aug 7, 2020	Deep Reinforcement LearningGraph Neural Network	CodeCode Available
Managing caching strategies for stream reasoning with reinforcement learning	Aug 7, 2020	Decision MakingManagement	—Unverified
Physics-Based Dexterous Manipulations with Estimated Hand Poses and Residual Reinforcement Learning	Aug 7, 2020	3D Hand Pose EstimationHand Pose Estimation	—Unverified
Mixed-Initiative Level Design with RL Brush	Aug 6, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Towards General and Autonomous Learning of Core Skills: A Case Study in Locomotion	Aug 6, 2020	Reinforcement Learning (RL)	—Unverified
Deep Q-Network Based Multi-agent Reinforcement Learning with Binary Action Agents	Aug 6, 2020	Multi-agent Reinforcement LearningOpenAI Gym	—Unverified
A Gentle Lecture Note on Filtrations in Reinforcement Learning	Aug 6, 2020	Decision Makingreinforcement-learning	—Unverified
Deep reinforcement learning to detect brain lesions on MRI: a proof-of-concept application of reinforcement learning to medical images	Aug 6, 2020	Deep LearningDeep Reinforcement Learning	—Unverified
Adaptive Coordination Offsets for Signalized Arterial Intersections using Deep Reinforcement Learning	Aug 6, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Tactile Robotics: Learning to Type on a Braille Keyboard	Aug 6, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Area-wide traffic signal control based on a deep graph Q-Network (DGQN) trained in an asynchronous manner	Aug 5, 2020	Reinforcement Learning (RL)Traffic Signal Control	—Unverified
Deep Reinforcement Learning for Field Development Optimization	Aug 5, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning Power Control from a Fixed Batch of Data	Aug 5, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning-driven Information Seeking: A Quantum Probabilistic Approach	Aug 5, 2020	Information Retrievalreinforcement-learning	—Unverified
Optimizing AD Pruning of Sponsored Search with Reinforcement Learning	Aug 5, 2020	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 422 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified