Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4951–4975 of 15113 papers

Title	Date	Tasks	Status
Reinforcement Learning for Ultrasound Image Analysis A Comprehensive Review of Advances and Applications	Feb 20, 2025	Decision MakingDeep Reinforcement Learning	—Unverified
Reinforcement Learning for Variable Selection in a Branch and Bound Algorithm	May 20, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control	Jan 30, 2024	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for Visual Object Detection	Jun 1, 2016	Objectobject-detection	—Unverified
Reinforcement Learning for Volt-Var Control: A Novel Two-stage Progressive Training Strategy	Nov 23, 2021	Ingenuityreinforcement-learning	—Unverified
Reinforcement Learning for Weakly Supervised Temporal Grounding of Natural Language in Untrimmed Videos	Sep 18, 2020	cross-modal alignmentreinforcement-learning	—Unverified
Reinforcement Learning Framework for Opportunistic Routing in WSNs	Oct 31, 2013	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Framework for Quantitative Trading	Nov 12, 2024	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Framework for Server Placement and Workload Allocation in Multi-Access Edge Computing	Feb 21, 2022	Cloud ComputingCombinatorial Optimization	—Unverified
Reinforcement learning framework for the mechanical design of microelectronic components under multiphysics constraints	Apr 23, 2025	global-optimizationreinforcement-learning	—Unverified
Reinforcement Learning from Bagged Reward	Feb 6, 2024	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning from Demonstrations by Novel Interactive Expert and Application to Automatic Berthing Control Systems for Unmanned Surface Vessel	Feb 23, 2022	Model Predictive Controlreinforcement-learning	—Unverified
Reinforcement Learning from Diverse Human Preferences	Jan 27, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning from Imperfect Demonstrations	Feb 14, 2018	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning From Imperfect Corrective Actions And Proxy Rewards	Oct 8, 2024	Atari GamesAutonomous Driving	—Unverified
Reinforcement Learning from Imperfect Demonstrations under Soft Expert Guidance	Nov 16, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning from LLM Feedback to Counteract Goal Misgeneralization	Jan 14, 2024	Language ModelingLanguage Modelling	—Unverified
Reinforcement Learning-Guided Semi-Supervised Learning	May 2, 2024	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in 20Q Game with Generic Knowledge Bases	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in a Birth and Death Process: Breaking the Dependence on the State Space	Feb 21, 2023	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in Agent-Based Market Simulation: Unveiling Realistic Stylized Facts and Behavior	Mar 28, 2024	Reinforcement Learning (RL)	—Unverified
Reinforcement Learning in a large scale photonic Recurrent Neural Network	Nov 14, 2017	BIG-bench Machine Learningreinforcement-learning	—Unverified
Reinforcement Learning in a Neurally Controlled Robot Using Dopamine Modulated STDP	Feb 21, 2015	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in a Safety-Embedded MDP with Trajectory Optimization	Oct 10, 2023	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in Categorical Cybernetics	Apr 3, 2024	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 199 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified