Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4451–4460 of 15113 papers

Title	Date	Tasks	Status
A Graph Neural Network-Based QUBO-Formulated Hamiltonian-Inspired Loss Function for Combinatorial Optimization using Reinforcement Learning	Nov 27, 2023	Combinatorial OptimizationGraph Neural Network	—Unverified
A Graph Policy Network Approach for Volt-Var Control in Power Distribution Systems	Sep 24, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
A gray-box approach for curriculum learning	Jun 17, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Greedy Approximation of Bayesian Reinforcement Learning with Probably Optimistic Transition Model	Mar 13, 2013	reinforcement-learningReinforcement Learning	—Unverified
A Guider Network for Multi-Dual Learning	May 1, 2019	Machine TranslationNMT	—Unverified
A Guiding Principle for Causal Decision Problems	Feb 6, 2019	Decision Makingreinforcement-learning	—Unverified
A Heuristically Assisted Deep Reinforcement Learning Approach for Network Slice Placement	May 14, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Hierarchical Bayesian Approach to Inverse Reinforcement Learning with Symbolic Reward Machines	Apr 20, 2022	reinforcement-learningReinforcement Learning	—Unverified
A Hierarchical Deep Reinforcement Learning Framework for 6-DOF UCAV Air-to-Air Combat	Dec 5, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
A Hierarchical Framework of Cloud Resource Allocation and Power Management Using Deep Reinforcement Learning	Mar 13, 2017	Cloud ComputingDecision Making	—Unverified

Show:10 25 50

← PrevPage 446 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified