Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4101–4150 of 15113 papers

Title	Date	Tasks	Status
Active Predictive Coding: A Unified Neural Framework for Learning Hierarchical World Models for Perception and Planning	Oct 23, 2022	reinforcement-learningReinforcement Learning	—Unverified
Active Privacy-utility Trade-off Against a Hypothesis Testing Adversary	Feb 16, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Active Reinforcement Learning -- A Roadmap Towards Curious Classifier Systems for Self-Adaptation	Jan 11, 2022	Active LearningAnomaly Detection	—Unverified
Active Reinforcement Learning: Observing Rewards at a Cost	Nov 13, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified
Active Reinforcement Learning over MDPs	Aug 5, 2021	reinforcement-learningReinforcement Learning	—Unverified
Active Reinforcement Learning with Monte-Carlo Tree Search	Mar 13, 2018	reinforcement-learningReinforcement Learning	—Unverified
ActiveRIR: Active Audio-Visual Exploration for Acoustic Environment Modeling	Apr 24, 2024	Reinforcement Learning (RL)	—Unverified
Active Screening for Recurrent Diseases: A Reinforcement Learning Approach	Jan 7, 2021	Combinatorial Optimizationreinforcement-learning	—Unverified
Active search and coverage using point-cloud reinforcement learning	Dec 18, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
CAVEN: An Embodied Conversational Agent for Efficient Audio-Visual Navigation in Noisy Environments	Jun 6, 2023	Hierarchical Reinforcement LearningNavigate	—Unverified
Active Vision for Early Recognition of Human Actions	Jun 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Actor-Critic Algorithm for High-dimensional Partial Differential Equations	Oct 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning to sample fibers for goodness-of-fit testing	May 22, 2024	Reinforcement Learning (RL)	—Unverified
Actor-Critic based Improper Reinforcement Learning	Jul 19, 2022	reinforcement-learningReinforcement Learning	—Unverified
Actor-Critic Deep Reinforcement Learning for Dynamic Multichannel Access	Oct 8, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Actor-Critic Deep Reinforcement Learning for Solving Job Shop Scheduling Problems	Apr 14, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Actor-Critic for Linearly-Solvable Continuous MDP with Partially Known Dynamics	Jun 4, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Actor-Critic learning for mean-field control in continuous time	Mar 13, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Actor-Critic Network for O-RAN Resource Allocation: xApp Design, Deployment, and Analysis	Sep 26, 2022	Reinforcement Learning (RL)	—Unverified
Actor-Critic Network for Q&A in an Adversarial Environment	Jan 3, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Actor-Critic Policy Optimization in Partially Observable Multiagent Environments	Oct 21, 2018	reinforcement-learningReinforcement Learning	—Unverified
Actor-Critic Reinforcement Learning with Simultaneous Human Control and Feedback	Mar 3, 2017	reinforcement-learningReinforcement Learning	—Unverified
Actor-Critic Reinforcement Learning with Phased Actor	Apr 18, 2024	Policy Gradient Methodsreinforcement-learning	—Unverified
Actor-Critics Can Achieve Optimal Sample Efficiency	May 6, 2025	Reinforcement Learning (RL)	—Unverified
Actor-Critic Scheduling for Path-Aware Air-to-Ground Multipath Multimedia Delivery	Apr 28, 2022	ManagementReinforcement Learning (RL)	—Unverified
Actor-Critic Sequence Training for Image Captioning	Jun 29, 2017	AI AgentImage Captioning	—Unverified
Actor Critic with Differentially Private Critic	Oct 14, 2019	reinforcement-learningReinforcement Learning	—Unverified
Actor-Critic with variable time discretization via sustained actions	Aug 8, 2023	Reinforcement Learning (RL)	—Unverified
Actor-Director-Critic: A Novel Deep Reinforcement Learning Framework	Jan 10, 2023	Action ClassificationDecision Making	—Unverified
ACTRCE: Augmenting Experience via Teacher's Advice For Multi-Goal Reinforcement Learning	Feb 12, 2019	Multi-Goal Reinforcement Learningreinforcement-learning	—Unverified
ACTRCE: Augmenting Experience via Teacher’s Advice	May 1, 2019	reinforcement-learningReinforcement Learning	—Unverified
ActSafe: Active Exploration with Safety Constraints for Reinforcement Learning	Oct 12, 2024	Efficient Explorationreinforcement-learning	—Unverified
A Cubic-regularized Policy Newton Algorithm for Reinforcement Learning	Apr 21, 2023	reinforcement-learningReinforcement Learning	—Unverified
AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning	May 17, 2025	Reinforcement Learning (RL)	—Unverified
AdaCred: Adaptive Causal Decision Transformers with Feature Crediting	Dec 19, 2024	AttributeImitation Learning	—Unverified
AdaMemento: Adaptive Memory-Assisted Policy Optimization for Reinforcement Learning	Oct 6, 2024	Ensemble Learningreinforcement-learning	—Unverified
Adam on Local Time: Addressing Nonstationarity in RL with Relative Adam Timesteps	Dec 22, 2024	Reinforcement Learning (RL)	—Unverified
Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation	Jun 9, 2023	Policy Gradient Methodsreinforcement-learning	—Unverified
adaPARL: Adaptive Privacy-Aware Reinforcement Learning for Sequential-Decision Making Human-in-the-Loop Systems	Mar 7, 2023	Decision MakingReinforcement Learning (RL)	—Unverified
AdaPool: A Diurnal-Adaptive Fleet Management Framework using Model-Free Deep Reinforcement Learning and Change Point Detection	Apr 1, 2021	Change Point DetectionDeep Reinforcement Learning	—Unverified
AdapShare: An RL-Based Dynamic Spectrum Sharing Solution for O-RAN	Aug 29, 2024	FairnessReinforcement Learning (RL)	—Unverified
Adaptable Automation with Modular Deep Reinforcement Learning and Policy Transfer	Nov 27, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Query Rewriting for Effective Misinformation Discovery	Oct 14, 2022	Misinformationreinforcement-learning	—Unverified
Adaptable image quality assessment using meta-reinforcement learning of task amenability	Jul 31, 2021	image-classificationImage Classification	—Unverified
Adaptable Recovery Behaviors in Robotics: A Behavior Trees and Motion Generators(BTMG) Approach for Failure Management	Apr 9, 2024	ManagementReinforcement Learning (RL)	—Unverified
Adaptation of Quadruped Robot Locomotion with Meta-Learning	Jul 8, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified
AdapThink: Adaptive Thinking Preferences for Reasoning Language Model	Jun 23, 2025	DiversityLanguage Modeling	—Unverified
Adapting Auxiliary Losses Using Gradient Similarity	Dec 5, 2018	Atari Gamesreinforcement-learning	—Unverified
Adapting Behaviour via Intrinsic Reward: A Survey and Empirical Study	Jun 19, 2019	Active Learningreinforcement-learning	—Unverified
Adapting Sampling Interval of Sensor Networks Using On-Line Reinforcement Learning	Jun 7, 2016	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 83 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified