Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9301–9350 of 15113 papers

Title	Date	Tasks	Status
Reinforcement Learning: Prediction, Control and Value Function Approximation	Aug 28, 2019	BIG-bench Machine LearningPrediction	—Unverified
Reinforcement Learning Problem Solving with Large Language Models	Apr 29, 2024	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning reveals fundamental limits on the mixing of active particles	May 28, 2021	Open-Ended Question Answeringreinforcement-learning	—Unverified
Reinforcement learning reward function in unmanned aerial vehicle control tasks	Mar 20, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
On-demand Cold Start Frequency Reduction with Off-Policy Reinforcement Learning in Serverless Computing	Aug 15, 2023	Cloud ComputingCPU	—Unverified
Reinforcement Learning (RL) Meets Urban Climate Modeling: Investigating the Efficacy and Impacts of RL-Based HVAC Control	May 11, 2025	Reinforcement Learning (RL)	—Unverified
Reinforcement Learning Scheduler for Vehicle-to-Vehicle Communications Outside Coverage	Apr 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning State Estimation for High-Dimensional Nonlinear Systems	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Teachers of Test Time Scaling	Jun 10, 2025	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement learning techniques for Outer Loop Link Adaptation in 4G/5G systems	Aug 3, 2017	Multi-Armed Banditsreinforcement-learning	—Unverified
Reinforcement Learning through Active Inference	Feb 28, 2020	Decision Makingreinforcement-learning	—Unverified
Reinforcement Learning To Adapt Speech Enhancement to Instantaneous Input Signal Quality	Nov 29, 2017	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning to Optimize Lifetime Value in Cold-Start Recommendation	Aug 20, 2021	Recommendation Systemsreinforcement-learning	—Unverified
Reinforcement Learning to Optimize Long-term User Engagement in Recommender Systems	Feb 13, 2019	Recommendation Systemsreinforcement-learning	—Unverified
Reinforcement Learning to Optimize the Logistics Distribution Routes of Unmanned Aerial Vehicle	Apr 21, 2020	Combinatorial Optimizationreinforcement-learning	—Unverified
Reinforcement Learning to Rank with Coarse-grained Labels	Aug 16, 2022	Information RetrievalLearning-To-Rank	—Unverified
Reinforcement Learning to Solve NP-hard Problems: an Application to the CVRP	Jan 14, 2022	Combinatorial Optimizationreinforcement-learning	—Unverified
Reinforcement Learning Tracking Control for Robotic Manipulator With Kernel-Based Dynamic Model	Jan 9, 2020	continuous-controlContinuous Control	—Unverified
Reinforcement Learning: Tutorial and Survey	Jul 18, 2024	Deep Reinforcement LearningGeneral Reinforcement Learning	—Unverified
Reinforcement Learning Under Algorithmic Triage	Sep 23, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning under a Multi-agent Predictive State Representation Model: Method and Theory	Sep 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Non-Stationary Reinforcement Learning: The Blessing of (More) Optimism	Jun 7, 2019	Decision Makingreinforcement-learning	—Unverified
Reinforcement Learning under Model Mismatch	Jun 15, 2017	modelQ-Learning	—Unverified
Reinforcement Learning under Partial Observability Guided by Learned Environment Models	Jun 23, 2022	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning Under Probabilistic Spatio-Temporal Constraints with Time Windows	Jul 29, 2023	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learningx2013Based Transient Response Shaping for Microgrids	Jul 11, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning using Augmented Neural Networks	Jun 20, 2018	Q-Learningreinforcement-learning	—Unverified
Reinforcement learning using Deep Q Networks and Q learning accurately localizes brain tumors on MRI with very small training sets	Oct 21, 2020	Keypoint DetectionQ-Learning	—Unverified
Reinforcement Learning using Guided Observability	Apr 22, 2021	Decision MakingMuJoCo	—Unverified
Reinforcement Learning using Kernel-Based Stochastic Factorization	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Using Quantum Boltzmann Machines	Dec 17, 2016	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning via AIXI Approximation	Jul 13, 2010	General Reinforcement LearningOpen-Ended Question Answering	—Unverified
Reinforcement Learning via Gaussian Processes with Neural Network Dual Kernels	Apr 10, 2020	Gaussian Processesreinforcement-learning	—Unverified
Reinforcement Learning via Reasoning from Demonstration	Apr 12, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning via Replica Stacking of Quantum Measurements for the Training of Quantum Boltzmann Machines	Jan 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Coarse-to-fine Q-Network with Action Sequence for Data-Efficient Robot Learning	Nov 19, 2024	Humanoid Controlreinforcement-learning	—Unverified
Reinforcement Learning with Adaptive Curriculum Dynamics Randomization for Fault-Tolerant Robot Control	Nov 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning with a Disentangled Universal Value Function for Item Recommendation	Apr 7, 2021	Model-based Reinforcement LearningRecommendation Systems	—Unverified
Reinforcement Learning with Almost Sure Constraints	Dec 9, 2021	Navigatereinforcement-learning	—Unverified
Reinforcement Learning with Analogical Similarity to Guide Schema Induction and Attention	Dec 28, 2017	Analogical Similarityreinforcement-learning	—Unverified
Reinforcement Learning with Attention that Works: A Self-Supervised Approach	Apr 6, 2019	Atari Gamesreinforcement-learning	—Unverified
Reinforcement Learning with Automated Auxiliary Loss Search	Oct 12, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Bayesian Classifiers: Efficient Skill Learning from Outcome Examples	Jan 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Budget-Constrained Nonparametric Function Approximation for Opportunistic Spectrum Access	Jun 14, 2017	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Chromatic Networks for Compact Architecture Search	Jul 10, 2019	Combinatorial OptimizationNeural Architecture Search	—Unverified
Reinforcement Learning with Chromatic Networks	Sep 25, 2019	Neural Architecture Searchreinforcement-learning	—Unverified
Reinforcement Learning with Competitive Ensembles of Information-Constrained Primitives	Jun 25, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning with Convolutional Reservoir Computing	Dec 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement learning with Demonstrations from Mismatched Task under Sparse Reward	Dec 3, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Depreciating Assets	Feb 27, 2023	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 187 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified