Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5951–5975 of 15113 papers

Title	Date	Tasks	Status
ShieldNN: A Provably Safe NN Filter for Unsafe NN Controllers	Jun 16, 2020	Reinforcement Learning (RL)	—Unverified
SHIRO: Soft Hierarchical Reinforcement Learning	Dec 24, 2022	Decision MakingEfficient Exploration	—Unverified
Short Quantum Circuits in Reinforcement Learning Policies for the Vehicle Routing Problem	Sep 15, 2021	BIG-bench Machine Learningreinforcement-learning	—Unverified
Should I Run Offline Reinforcement Learning or Behavioral Cloning?	Sep 29, 2021	Atari GamesDiagnostic	—Unverified
Should I send this notification? Optimizing push notifications decision making by modeling the future	Feb 17, 2022	Decision MakingModel-based Reinforcement Learning	—Unverified
Should we use model-free or model-based control? A case study of battery management systems	Jul 22, 2024	Managementmodel	—Unverified
Show, Attend and Interact: Perceivable Human-Robot Social Interaction through Neural Attention Q-Network	Feb 28, 2017	Deep Attentionreinforcement-learning	—Unverified
Show, Don't Tell: Learning Reward Machines from Demonstrations for Reinforcement Learning-Based Cardiac Pacemaker Synthesis	Nov 4, 2024	Reinforcement Learning (RL)	—Unverified
Showing versus doing: Teaching by demonstration	Dec 1, 2016	reinforcement-learningReinforcement Learning	—Unverified
Showing Your Offline Reinforcement Learning Work: Online Evaluation Budget Matters	Oct 8, 2021	Decision Makingenergy management	—Unverified
Show me the Way: Intrinsic Motivation from Demonstrations	Jun 23, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Show me what you want: Inverse reinforcement learning to automatically design robot swarms by demonstration	Jan 17, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Show Us the Way: Learning to Manage Dialog from Demonstrations	Apr 17, 2020	dialog state trackingManagement	—Unverified
Shrinkage-based Bias-Variance Trade-off for Deep Reinforcement Learning	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
ShrinkML: End-to-End ASR Model Compression Using Reinforcement Learning	Jul 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SIBRE: Self Improvement Based REwards for Adaptive Feedback in Reinforcement Learning	Apr 21, 2020	reinforcement-learningReinforcement Learning	—Unverified
SIDE: State Inference for Partially Observable Cooperative Multi-Agent Reinforcement Learning	May 13, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Sigmoid-Weighted Linear Units for Neural Network Function Approximation in Reinforcement Learning	Feb 10, 2017	Atari GamesDeep Reinforcement Learning	—Unverified
Signal Instructed Coordination in Cooperative Multi-agent Reinforcement Learning	Sep 10, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Signal Temporal Logic Neural Predictive Control	Sep 10, 2023	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Sign and Relevance Learning	Oct 14, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Sim2real for Reinforcement Learning Driven Next Generation Networks	Jun 8, 2022	Data Interactionreinforcement-learning	—Unverified
Sim-and-Real Reinforcement Learning for Manipulation: A Consensus-based Approach	Feb 26, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
Similarities between policy gradient methods (PGM) in Reinforcement learning (RL) and supervised learning (SL)	Apr 12, 2019	Decision MakingPolicy Gradient Methods	—Unverified
SIMILE: Introducing Sequential Information towards More Effective Imitation Learning	May 1, 2019	Imitation LearningOpenAI Gym	—Unverified

Show:10 25 50

← PrevPage 239 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified