Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10051–10100 of 15113 papers

Title	Date	Tasks	Status	Hype
GRIMGEP: Learning Progress for Robust Goal Sampling in Visual Deep Reinforcement Learning	Aug 10, 2020	Deep Reinforcement LearningDiversity	—Unverified	0
Deep Reinforcement Learning with Label Embedding Reward for Supervised Image Hashing	Aug 10, 2020	BinarizationDecision Making	—Unverified	0
Hierarchical Reinforcement Learning in StarCraft II with Human Expertise in Subgoals Selection	Aug 8, 2020	Decision MakingHierarchical Reinforcement Learning	—Unverified	0
TriFinger: An Open-Source Robot for Learning Dexterity	Aug 8, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Managing caching strategies for stream reasoning with reinforcement learning	Aug 7, 2020	Decision MakingManagement	—Unverified	0
SafePILCO: a software tool for safe and data-efficient policy synthesis	Aug 7, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Physics-Based Dexterous Manipulations with Estimated Hand Poses and Residual Reinforcement Learning	Aug 7, 2020	3D Hand Pose EstimationHand Pose Estimation	—Unverified	0
Towards Sample Efficient Agents through Algorithmic Alignment	Aug 7, 2020	Deep Reinforcement LearningGraph Neural Network	CodeCode Available	0
Distributed Deep Reinforcement Learning for Functional Split Control in Energy Harvesting Virtualized Small Cells	Aug 7, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Incremental Text to Speech for Neural Sequence-to-Sequence Models using Reinforcement Learning	Aug 7, 2020	Audio Generationreinforcement-learning	—Unverified	0
A Machine of Few Words -- Interactive Speaker Recognition with Reinforcement Learning	Aug 7, 2020	Decision Makingreinforcement-learning	—Unverified	0
Adaptive Coordination Offsets for Signalized Arterial Intersections using Deep Reinforcement Learning	Aug 6, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Towards General and Autonomous Learning of Core Skills: A Case Study in Locomotion	Aug 6, 2020	Reinforcement Learning (RL)	—Unverified	0
The Emergence of Adversarial Communication in Multi-Agent Reinforcement Learning	Aug 6, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
A Gentle Lecture Note on Filtrations in Reinforcement Learning	Aug 6, 2020	Decision Makingreinforcement-learning	—Unverified	0
Contrastive Variational Reinforcement Learning for Complex Observations	Aug 6, 2020	Atari GamesContinuous Control	CodeCode Available	1
Deep Q-Network Based Multi-agent Reinforcement Learning with Binary Action Agents	Aug 6, 2020	Multi-agent Reinforcement LearningOpenAI Gym	—Unverified	0
Deep Reinforcement Learning for Tactile Robotics: Learning to Type on a Braille Keyboard	Aug 6, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Fashion Captioning: Towards Generating Accurate Descriptions with Semantic Rewards	Aug 6, 2020	AttributeImage Captioning	CodeCode Available	1
Decoupling Exploration and Exploitation for Meta-Reinforcement Learning without Sacrifices	Aug 6, 2020	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep reinforcement learning to detect brain lesions on MRI: a proof-of-concept application of reinforcement learning to medical images	Aug 6, 2020	Deep LearningDeep Reinforcement Learning	—Unverified	0
Mixed-Initiative Level Design with RL Brush	Aug 6, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Deep Reinforcement Learning for Field Development Optimization	Aug 5, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning Power Control from a Fixed Batch of Data	Aug 5, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning-driven Information Seeking: A Quantum Probabilistic Approach	Aug 5, 2020	Information Retrievalreinforcement-learning	—Unverified	0
Optimizing AD Pruning of Sponsored Search with Reinforcement Learning	Aug 5, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Robust Deep Reinforcement Learning through Adversarial Loss	Aug 5, 2020	Adversarial AttackAtari Games	CodeCode Available	1
Fast Adaptive Task Offloading in Edge Computing based on Meta Reinforcement Learning	Aug 5, 2020	Deep Reinforcement LearningEdge-computing	CodeCode Available	1
Area-wide traffic signal control based on a deep graph Q-Network (DGQN) trained in an asynchronous manner	Aug 5, 2020	Reinforcement Learning (RL)Traffic Signal Control	—Unverified	0
Aligning AI With Shared Human Values	Aug 5, 2020	Ethicsreinforcement-learning	CodeCode Available	2
A Comparative Analysis of Deep Reinforcement Learning-enabled Freeway Decision-making for Automated Vehicles	Aug 4, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Faded-Experience Trust Region Policy Optimization for Model-Free Power Allocation in Interference Channel	Aug 4, 2020	Decision Makingreinforcement-learning	—Unverified	0
Explanation of Reinforcement Learning Model in Dynamic Multi-Agent System	Aug 4, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Relearning Approach to Reinforcement Learning for Control of Smart Buildings	Aug 4, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
EasyRL: A Simple and Extensible Reinforcement Learning Framework	Aug 4, 2020	OpenAI Gymreinforcement-learning	—Unverified	0
Learning Transition Models with Time-delayed Causal Relations	Aug 4, 2020	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Robust Reinforcement Learning using Adversarial Populations	Aug 4, 2020	Out-of-Distribution Generalizationreinforcement-learning	CodeCode Available	1
Reinforced Epidemic Control: Saving Both Lives and Economy	Aug 4, 2020	Graph Neural Networkreinforcement-learning	CodeCode Available	1
Fully Decentralized Reinforcement Learning-based Control of Photovoltaics in Distribution Grids for Joint Provision of Real and Reactive Power	Aug 3, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Learning to Play Two-Player Perfect-Information Games without Knowledge	Aug 3, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Agile Locomotion via Adversarial Training	Aug 3, 2020	Reinforcement Learning (RL)	—Unverified	0
Dynamics Generalization via Information Bottleneck in Deep Reinforcement Learning	Aug 3, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Cooperative Control of Mobile Robots with Stackelberg Learning	Aug 3, 2020	Deep Reinforcement LearningQ-Learning	—Unverified	0
Proximal Deterministic Policy Gradient	Aug 3, 2020	continuous-controlContinuous Control	—Unverified	0
Tracking the Race Between Deep Reinforcement Learning and Imitation Learning -- Extended Version	Aug 3, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Curriculum Learning with a Progression Function	Aug 2, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Spatial Geometric Reasoning for Room Layout Estimation via Deep Reinforcement Learning	Aug 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Neural Batch Sampling with Reinforcement Learning for Semi-Supervised Anomaly Detection	Aug 1, 2020	Anomaly Detectionreinforcement-learning	—Unverified	0
Learning with Safety Constraints: Sample Complexity of Reinforcement Learning for Constrained MDPs	Aug 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Deep Reinforcement Learning Based Mobile Edge Computing for Intelligent Internet of Things	Aug 1, 2020	Deep Reinforcement LearningEdge-computing	—Unverified	0

Show:10 25 50

← PrevPage 202 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified