Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5051–5075 of 15113 papers

Title	Date	Tasks	Status
Reinforcement Learning to Rank with Coarse-grained Labels	Aug 16, 2022	Information RetrievalLearning-To-Rank	—Unverified
Reinforcement Learning to Solve NP-hard Problems: an Application to the CVRP	Jan 14, 2022	Combinatorial Optimizationreinforcement-learning	—Unverified
Reinforcement Learning Tracking Control for Robotic Manipulator With Kernel-Based Dynamic Model	Jan 9, 2020	continuous-controlContinuous Control	—Unverified
Reinforcement Learning: Tutorial and Survey	Jul 18, 2024	Deep Reinforcement LearningGeneral Reinforcement Learning	—Unverified
Reinforcement Learning Under Algorithmic Triage	Sep 23, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning under a Multi-agent Predictive State Representation Model: Method and Theory	Sep 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Non-Stationary Reinforcement Learning: The Blessing of (More) Optimism	Jun 7, 2019	Decision Makingreinforcement-learning	—Unverified
Reinforcement Learning under Model Mismatch	Jun 15, 2017	modelQ-Learning	—Unverified
Reinforcement Learning under Partial Observability Guided by Learned Environment Models	Jun 23, 2022	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning Under Probabilistic Spatio-Temporal Constraints with Time Windows	Jul 29, 2023	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learningx2013Based Transient Response Shaping for Microgrids	Jul 11, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning using Augmented Neural Networks	Jun 20, 2018	Q-Learningreinforcement-learning	—Unverified
Reinforcement learning using Deep Q Networks and Q learning accurately localizes brain tumors on MRI with very small training sets	Oct 21, 2020	Keypoint DetectionQ-Learning	—Unverified
Reinforcement Learning using Guided Observability	Apr 22, 2021	Decision MakingMuJoCo	—Unverified
Reinforcement Learning using Kernel-Based Stochastic Factorization	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Using Quantum Boltzmann Machines	Dec 17, 2016	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning via AIXI Approximation	Jul 13, 2010	General Reinforcement LearningOpen-Ended Question Answering	—Unverified
Reinforcement Learning via Gaussian Processes with Neural Network Dual Kernels	Apr 10, 2020	Gaussian Processesreinforcement-learning	—Unverified
Reinforcement Learning via Reasoning from Demonstration	Apr 12, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning via Replica Stacking of Quantum Measurements for the Training of Quantum Boltzmann Machines	Jan 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Coarse-to-fine Q-Network with Action Sequence for Data-Efficient Robot Learning	Nov 19, 2024	Humanoid Controlreinforcement-learning	—Unverified
Reinforcement Learning with Adaptive Curriculum Dynamics Randomization for Fault-Tolerant Robot Control	Nov 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning with a Disentangled Universal Value Function for Item Recommendation	Apr 7, 2021	Model-based Reinforcement LearningRecommendation Systems	—Unverified
Reinforcement Learning with Almost Sure Constraints	Dec 9, 2021	Navigatereinforcement-learning	—Unverified
Reinforcement Learning with Analogical Similarity to Guide Schema Induction and Attention	Dec 28, 2017	Analogical Similarityreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 203 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified