Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10501–10550 of 15113 papers

Title	Date	Tasks	Status	Hype
Policy Optimization for H_2 Linear Control with H_ Robustness Guarantee: Implicit Regularization and Global Convergence	Jun 8, 2020	Reinforcement Learning (RL)	—Unverified	0
Tools for Data-driven Modeling of Within-Hand Manipulation with Underactuated Adaptive Hands	Jun 8, 2020	Model-based Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Online Data Poisoning Attacks	Jun 8, 2020	Data PoisoningDeep Reinforcement Learning	—Unverified	0
Scalable Reinforcement Learning of Localized Policies for Multi-Agent Networked Systems	Jun 8, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Maximum Entropy Model Rollouts: Fast Model Based Policy Optimization without Compounding Errors	Jun 8, 2020	modelModel-based Reinforcement Learning	—Unverified	0
Balancing a CartPole System with Reinforcement Learning -- A Tutorial	Jun 8, 2020	OpenAI GymQ-Learning	—Unverified	0
Conservative Q-Learning for Offline Reinforcement Learning	Jun 8, 2020	continuous-controlContinuous Control	CodeCode Available	1
A Comparison of Self-Play Algorithms Under a Generalized Framework	Jun 8, 2020	Reinforcement Learning (RL)	—Unverified	0
A Decentralized Policy Gradient Approach to Multi-task Reinforcement Learning	Jun 8, 2020	Atari GamesMulti-Task Learning	—Unverified	0
Hallucinating Value: A Pitfall of Dyna-style Planning with Imperfect Environment Models	Jun 8, 2020	Reinforcement Learning (RL)	—Unverified	0
A Model-free Learning Algorithm for Infinite-horizon Average-reward MDPs with Near-optimal Regret	Jun 8, 2020	Q-Learningreinforcement-learning	—Unverified	0
Learning to Play No-Press Diplomacy with Best Response Policy Iteration	Jun 8, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Stable Reinforcement Learning with Unbounded State Space	Jun 8, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning Under Moral Uncertainty	Jun 8, 2020	Autonomous VehiclesBIG-bench Machine Learning	CodeCode Available	1
Randomized Policy Learning for Continuous State and Action MDPs	Jun 8, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Skill Discovery of Coordination in Multi-agent Reinforcement Learning	Jun 7, 2020	DiversityMulti-agent Reinforcement Learning	—Unverified	0
Reinforcement Learning for Multi-Product Multi-Node Inventory Management in Supply Chains	Jun 7, 2020	Decision MakingHierarchical Reinforcement Learning	CodeCode Available	1
Real-Time Model Calibration with Deep Reinforcement Learning	Jun 7, 2020	Deep Reinforcement Learningmodel	—Unverified	0
Multi-Task Reinforcement Learning based Mobile Manipulation Control for Dynamic Object Tracking and Grasping	Jun 7, 2020	ObjectObject Tracking	—Unverified	0
Efficient Poverty Mapping using Deep Reinforcement Learning	Jun 7, 2020	Deep Reinforcement Learningobject-detection	—Unverified	0
Dual Policy Distillation	Jun 7, 2020	continuous-controlContinuous Control	CodeCode Available	0
Implications of Human Irrationality for Reinforcement Learning	Jun 7, 2020	BIG-bench Machine LearningDecision Making	—Unverified	0
Incorporating Pragmatic Reasoning Communication into Emergent Language	Jun 7, 2020	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Randomized Entity-wise Factorization for Multi-Agent Reinforcement Learning	Jun 7, 2020	counterfactualMulti-agent Reinforcement Learning	CodeCode Available	1
Efficient Evaluation of Natural Stochastic Policies in Offline Reinforcement Learning	Jun 6, 2020	Off-policy evaluationreinforcement-learning	—Unverified	0
Model-Free Reinforcement Learning: from Clipped Pseudo-Regret to Sample Complexity	Jun 6, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Proximal Gradient Temporal Difference Learning: Stable Reinforcement Learning with Polynomial Sample Complexity	Jun 6, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Stable and Efficient Policy Evaluation	Jun 6, 2020	Reinforcement Learning (RL)	—Unverified	0
State Action Separable Reinforcement Learning	Jun 5, 2020	Decision Makingreinforcement-learning	—Unverified	0
AutoHAS: Efficient Hyperparameter and Architecture Search	Jun 5, 2020	AutoMLHyperparameter Optimization	—Unverified	0
Deployment-Efficient Reinforcement Learning via Model-Based Offline Optimization	Jun 5, 2020	Offline RLreinforcement-learning	CodeCode Available	1
Curiosity Killed or Incapacitated the Cat and the Asymptotically Optimal Agent	Jun 5, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Balancing Reinforcement Learning Training Experiences in Interactive Information Retrieval	Jun 5, 2020	Information Retrievalreinforcement-learning	—Unverified	0
Visual Transfer for Reinforcement Learning via Wasserstein Domain Confusion	Jun 4, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Meta-Model-Based Meta-Policy Optimization	Jun 4, 2020	continuous-controlContinuous Control	—Unverified	0
Single-step deep reinforcement learning for open-loop control of laminar and turbulent flows	Jun 4, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Solving Hard AI Planning Instances Using Curriculum-Driven Deep Reinforcement Learning	Jun 4, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Refined Continuous Control of DDPG Actors via Parametrised Activation	Jun 4, 2020	continuous-controlContinuous Control	—Unverified	0
Constrained Reinforcement Learning for Dynamic Optimization under Uncertainty	Jun 4, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
A Novel Update Mechanism for Q-Networks Based On Extreme Learning Machines	Jun 4, 2020	Q-Learningreinforcement-learning	CodeCode Available	0
Causality and Batch Reinforcement Learning: Complementary Approaches To Planning In Unknown Domains	Jun 3, 2020	Autonomous DrivingCausal Inference	—Unverified	0
Interferobot: aligning an optical interferometer by a reinforcement learning agent	Jun 3, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Learning to Scan: A Deep Reinforcement Learning Approach for Personalized Scanning in CT Imaging	Jun 3, 2020	compressed sensingComputed Tomography (CT)	—Unverified	0
The Value-Improvement Path: Towards Better Representations for Reinforcement Learning	Jun 3, 2020	Atari Gamesreinforcement-learning	—Unverified	0
Temporally-Extended ε-Greedy Exploration	Jun 2, 2020	Reinforcement Learning (RL)	CodeCode Available	0
Jointly Learning Environments and Control Policies with Projected Stochastic Gradient Ascent	Jun 2, 2020	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available	0
Diversity Actor-Critic: Sample-Aware Entropy Regularization for Sample-Efficient Exploration	Jun 2, 2020	DiversityEfficient Exploration	CodeCode Available	0
Combining Reinforcement Learning and Constraint Programming for Combinatorial Optimization	Jun 2, 2020	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1
Active Vision for Early Recognition of Human Actions	Jun 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Mitigating Bias in Face Recognition Using Skewness-Aware Reinforcement Learning	Jun 1, 2020	Face RecognitionFairness	—Unverified	0

Show:10 25 50

← PrevPage 211 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified