Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4876–4900 of 15113 papers

Title	Date	Tasks	Status
Foundations for Restraining Bolts: Reinforcement Learning with LTLf/LDLf restraining specifications	Jul 17, 2018	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Machine Learning Model Deployment: Evaluating Multi-Armed Bandits in ML Ops Environments	Mar 28, 2025	ManagementModel Selection	—Unverified
Reinforcement Learning for Many-Body Ground-State Preparation Inspired by Counterdiabatic Driving	Oct 7, 2020	continuous-controlContinuous Control	—Unverified
Reinforcement Learning for Markovian Bandits: Is Posterior Sampling more Scalable than Optimism?	Jun 16, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning for Matrix Computations: PageRank as an Example	Nov 1, 2013	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Mean Field Game	May 30, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Mean Field Games, with Applications to Economics	Jun 25, 2021	Q-Learningreinforcement-learning	—Unverified
Distributed Reinforcement Learning for Age of Information Minimization in Real-Time IoT Systems	Apr 4, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning for Mitigating Intermittent Interference in Terahertz Communication Networks	Mar 10, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Mixed-Integer Problems Based on MPC	Apr 3, 2020	Model Predictive ControlQ-Learning	—Unverified
Reinforcement Learning for Motor Control: A Comprehensive Review	Dec 23, 2024	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Multi-Objective Optimization of Online Decisions in High-Dimensional Systems	Oct 1, 2019	Decision MakingManagement	—Unverified
Reinforcement Learning for Multi-Truck Vehicle Routing Problems	Nov 30, 2022	Combinatorial OptimizationDecoder	—Unverified
Reinforcement Learning for Nested Polar Code Construction	Apr 16, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Node Selection in Branch-and-Bound	Sep 29, 2023	Graph Neural Networkreinforcement-learning	—Unverified
Reinforcement learning for non-prehensile manipulation: Transfer from simulation to physical system	Mar 28, 2018	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for Non-Stationary Markov Decision Processes: The Blessing of (More) Optimism	Jun 24, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Omega-Regular Specifications on Continuous-Time MDP	Mar 16, 2023	Decision Makingreinforcement-learning	—Unverified
Reinforcement Learning for on-line Sequence Transformation	May 28, 2021	Machine Translationreinforcement-learning	—Unverified
Reinforcement Learning for Online Testing of Autonomous Driving Systems: a Replication and Extension Study	Mar 20, 2024	Autonomous DrivingQ-Learning	—Unverified
Reinforcement Learning for Optimal Control of a District Cooling Energy Plant	Mar 14, 2022	Model Predictive ControlQ-Learning	—Unverified
Reinforcement Learning for Optimal Load Distribution Sequencing in Resource-Sharing System	Feb 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement learning for optimization of variational quantum circuit architectures	Mar 30, 2021	reinforcement-learningReinforcement Learning	—Unverified
On-line reinforcement learning for optimization of real-life energy trading strategy	Mar 28, 2023	energy tradingreinforcement-learning	—Unverified
Reinforcement Learning for Optimized Beam Training in Multi-Hop Terahertz Communications	Feb 10, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 196 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified