Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5726–5750 of 15113 papers

Title	Date	Tasks	Status	Hype
Characterizing the Action-Generalization Gap in Deep Q-Learning	May 11, 2022	Q-LearningReinforcement Learning (RL)	—Unverified	0
Developing cooperative policies for multi-stage reinforcement learning tasks	May 11, 2022	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
VesNet-RL: Simulation-based Reinforcement Learning for Real-World US Probe Navigation	May 10, 2022	DiagnosticNavigate	CodeCode Available	1
State Encoders in Reinforcement Learning for Recommendation: A Reproducibility Study	May 10, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
On the Verge of Solving Rocket League using Deep Reinforcement Learning and Sim-to-sim Transfer	May 10, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Hybrid Reinforcement Learning for STAR-RISs: A Coupled Phase-Shift Model Based Beamformer	May 10, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Efficient Risk-Averse Reinforcement Learning	May 10, 2022	Autonomous Drivingreinforcement-learning	CodeCode Available	1
Gamma and Vega Hedging Using Deep Distributional Reinforcement Learning	May 10, 2022	Distributional Reinforcement LearningPosition	CodeCode Available	1
Accelerated Reinforcement Learning for Temporal Logic Control Objectives	May 9, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
DxFormer: A Decoupled Automatic Diagnostic System Based on Decoder-Encoder Transformer with Dense Symptom Representations	May 8, 2022	DecoderDiagnostic	CodeCode Available	1
Learning to Brachiate via Simplified Model Imitation	May 8, 2022	Humanoid Controlmodel	CodeCode Available	1
Introduction to Soar	May 8, 2022	ChunkingDecision Making	—Unverified	0
Simultaneous Double Q-learning with Conservative Advantage Learning for Actor-Critic Methods	May 8, 2022	continuous-controlContinuous Control	CodeCode Available	0
Applications of Reinforcement Learning in Deregulated Power Market: A Comprehensive Review	May 7, 2022	Computational EfficiencyDecision Making	—Unverified	0
Deep Reinforcement Learning-Based Adaptive IRS Control with Limited Feedback Codebooks	May 7, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Search-Based Testing of Reinforcement Learning	May 7, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
JUNO: Jump-Start Reinforcement Learning-based Node Selection for UWB Indoor Localization	May 6, 2022	Indoor Localizationreinforcement-learning	—Unverified	0
Dynamically writing coupled memories using a reinforcement learning agent, meeting physical bounds	May 6, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A Deep Reinforcement Learning-based Sliding Mode Control Design for Partially-known Nonlinear Systems	May 6, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning Approach to Estimation in Linear Systems	May 6, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Goal-Oriented Next Best Activity Recommendation using Reinforcement Learning	May 6, 2022	Activity Predictionreinforcement-learning	—Unverified	0
Alternating Good-for-MDP Automata	May 6, 2022	Reinforcement Learning (RL)Translation	—Unverified	0
How to Spend Your Robot Time: Bridging Kickstarting and Offline Reinforcement Learning for Vision-based Robotic Manipulation	May 6, 2022	Offline RLReinforcement Learning (RL)	—Unverified	0
Generative methods for sampling transition paths in molecular dynamics	May 5, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
LDSA: Learning Dynamic Subtask Assignment in Cooperative Multi-Agent Reinforcement Learning	May 5, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 230 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified