Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10851–10900 of 15113 papers

Title	Date	Tasks	Status
Zeroth-Order Supervised Policy Improvement	Jun 11, 2020	continuous-controlContinuous Control	—Unverified
Surveys without Questions: A Reinforcement Learning Approach	Jun 11, 2020	reinforcement-learningReinforcement Learning	—Unverified
Sample Efficient Reinforcement Learning via Low-Rank Matrix Estimation	Jun 11, 2020	Learning Theoryreinforcement-learning	—Unverified
Multi-Agent Informational Learning Processes	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Scalable Multi-Agent Reinforcement Learning for Networked Systems with Average Reward	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Off-Policy Risk-Sensitive Reinforcement Learning Based Constrained Robust Optimal Control	Jun 10, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Q-greedyUCB: a New Exploration Policy for Adaptive and Resource-efficient Scheduling	Jun 10, 2020	Decision MakingQ-Learning	—Unverified
Continuous Action Reinforcement Learning from a Mixture of Interpretable Experts	Jun 10, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Machine learning and control engineering: The model-free case	Jun 10, 2020	BIG-bench Machine Learningreinforcement-learning	—Unverified
Searching Learning Strategy with Reinforcement Learning for 3D Medical Image Segmentation	Jun 10, 2020	Data AugmentationImage Segmentation	—Unverified
Privacy-Cost Management in Smart Meters with Mutual Information-Based Reinforcement Learning	Jun 10, 2020	Deep Reinforcement LearningManagement	—Unverified
Multi-Agent Reinforcement Learning in a Realistic Limit Order Book Market Simulation	Jun 10, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Transient Non-Stationarity and Generalisation in Deep Reinforcement Learning	Jun 10, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Self-Supervised Reinforcement Learning for Recommender Systems	Jun 10, 2020	Q-LearningRecommendation Systems	—Unverified
Deep reinforcement learning for optical systems: A case study of mode-locked lasers	Jun 10, 2020	Deep Reinforcement LearningNavigate	—Unverified
Learning to Play Table Tennis From Scratch using Muscular Robots	Jun 10, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Development of A Stochastic Traffic Environment with Generative Time-Series Models for Improving Generalization Capabilities of Autonomous Driving Agents	Jun 10, 2020	Autonomous DrivingReinforcement Learning (RL)	—Unverified
Causal Discovery from Incomplete Data using An Encoder and Reinforcement Learning	Jun 9, 2020	Causal DiscoveryImputation	—Unverified
An overall view of key problems in algorithmic trading and recent progress	Jun 9, 2020	Algorithmic TradingBIG-bench Machine Learning	—Unverified
Distributed Learning on Heterogeneous Resource-Constrained Devices	Jun 9, 2020	Federated LearningReinforcement Learning (RL)	—Unverified
Stealing Deep Reinforcement Learning Models for Fun and Profit	Jun 9, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Policy-focused Agent-based Modeling using RL Behavioral Models	Jun 9, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
Online Learning in Iterated Prisoner's Dilemma to Mimic Human Behavior	Jun 9, 2020	Multi-Armed Banditsreinforcement-learning	CodeCode Available
Variational Model-based Policy Optimization	Jun 9, 2020	continuous-controlContinuous Control	—Unverified
Online Data Poisoning Attacks	Jun 8, 2020	Data PoisoningDeep Reinforcement Learning	—Unverified
Randomized Policy Learning for Continuous State and Action MDPs	Jun 8, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Tools for Data-driven Modeling of Within-Hand Manipulation with Underactuated Adaptive Hands	Jun 8, 2020	Model-based Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Stable Reinforcement Learning with Unbounded State Space	Jun 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Scalable Reinforcement Learning of Localized Policies for Multi-Agent Networked Systems	Jun 8, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Policy Optimization for H_2 Linear Control with H_ Robustness Guarantee: Implicit Regularization and Global Convergence	Jun 8, 2020	Reinforcement Learning (RL)	—Unverified
Maximum Entropy Model Rollouts: Fast Model Based Policy Optimization without Compounding Errors	Jun 8, 2020	modelModel-based Reinforcement Learning	—Unverified
Hallucinating Value: A Pitfall of Dyna-style Planning with Imperfect Environment Models	Jun 8, 2020	Reinforcement Learning (RL)	—Unverified
Learning to Plan via Deep Optimistic Value Exploration	Jun 8, 2020	BenchmarkingModel-based Reinforcement Learning	—Unverified
Balancing a CartPole System with Reinforcement Learning -- A Tutorial	Jun 8, 2020	OpenAI GymQ-Learning	—Unverified
A Decentralized Policy Gradient Approach to Multi-task Reinforcement Learning	Jun 8, 2020	Atari GamesMulti-Task Learning	—Unverified
A Comparison of Self-Play Algorithms Under a Generalized Framework	Jun 8, 2020	Reinforcement Learning (RL)	—Unverified
A Model-free Learning Algorithm for Infinite-horizon Average-reward MDPs with Near-optimal Regret	Jun 8, 2020	Q-Learningreinforcement-learning	—Unverified
Constrained Upper Confidence Reinforcement Learning with Known Dynamics	Jun 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning the model-free linear quadratic regulator via random search	Jun 8, 2020	Reinforcement Learning (RL)	—Unverified
Dual Policy Distillation	Jun 7, 2020	continuous-controlContinuous Control	CodeCode Available
Implications of Human Irrationality for Reinforcement Learning	Jun 7, 2020	BIG-bench Machine LearningDecision Making	—Unverified
Efficient Poverty Mapping using Deep Reinforcement Learning	Jun 7, 2020	Deep Reinforcement Learningobject-detection	—Unverified
Incorporating Pragmatic Reasoning Communication into Emergent Language	Jun 7, 2020	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Multi-Task Reinforcement Learning based Mobile Manipulation Control for Dynamic Object Tracking and Grasping	Jun 7, 2020	ObjectObject Tracking	—Unverified
Skill Discovery of Coordination in Multi-agent Reinforcement Learning	Jun 7, 2020	DiversityMulti-agent Reinforcement Learning	—Unverified
Real-Time Model Calibration with Deep Reinforcement Learning	Jun 7, 2020	Deep Reinforcement Learningmodel	—Unverified
Model-Free Reinforcement Learning: from Clipped Pseudo-Regret to Sample Complexity	Jun 6, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Stable and Efficient Policy Evaluation	Jun 6, 2020	Reinforcement Learning (RL)	—Unverified
Efficient Evaluation of Natural Stochastic Policies in Offline Reinforcement Learning	Jun 6, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Curiosity Killed or Incapacitated the Cat and the Asymptotically Optimal Agent	Jun 5, 2020	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 218 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified