Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4901–4925 of 15113 papers

Title	Date	Tasks	Status
Reinforcement Learning for Optimizing RAG for Domain Chatbots	Jan 10, 2024	ChatbotQuestion Answering	—Unverified
Reinforcement learning for options on target volatility funds	Dec 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Orientation Estimation Using Inertial Sensors with Performance Guarantee	Mar 3, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for Personalized Dialogue Management	Aug 1, 2019	Dialogue ManagementManagement	—Unverified
Reinforcement Learning for Personalized Drug Discovery and Design for Complex Diseases: A Systems Pharmacology Perspective	Jan 21, 2022	Drug DesignDrug Discovery	—Unverified
Reinforcement learning for port-Hamiltonian systems	Dec 21, 2012	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Predicting Traffic Accidents	Dec 9, 2022	Accident AnticipationAutonomous Driving	—Unverified
Reinforcement Learning for Predict+Optimize	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Process Control with Application in Semiconductor Manufacturing	Oct 22, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Protocol Synthesis in Resource-Constrained Wireless Sensor and IoT Networks	Jan 14, 2023	Fairnessreinforcement-learning	—Unverified
Reinforcement learning for pursuit and evasion of microswimmers at low Reynolds number	Jun 16, 2021	Positionreinforcement-learning	—Unverified
Reinforcement Learning for Quantitative Trading	Sep 28, 2021	Decision Makingreinforcement-learning	—Unverified
Reinforcement Learning for Rate Maximization in IRS-aided OWC Networks	Sep 7, 2024	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning for Resilient Power Grids	Dec 8, 2022	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning for Resource Allocation in Steerable Laser-based Optical Wireless Systems	Jun 21, 2021	ManagementQ-Learning	—Unverified
Reinforcement Learning for Ridesharing: An Extended Survey	May 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Robotics and Control with Active Uncertainty Reduction	May 15, 2019	ManagementOpenAI Gym	—Unverified
Reinforcement Learning for Robust Parameterized Locomotion Control of Bipedal Robots	Mar 26, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Robust Header Compression under Model Uncertainty	Sep 23, 2023	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Robust Missile Autopilot Design	Nov 26, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Safe Autonomous Two Device Navigation of Cerebral Vessels in Mechanical Thrombectomy	Mar 31, 2025	Autonomous NavigationNavigate	—Unverified
Reinforcement Learning for Safe Occupancy Strategies in Educational Spaces during an Epidemic	Dec 23, 2023	ManagementQ-Learning	—Unverified
Reinforcement Learning for Safe Robot Control using Control Lyapunov Barrier Functions	May 16, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning for Safety-Critical Control under Model Uncertainty, using Control Lyapunov Functions and Control Barrier Functions	Apr 16, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Scalable Logic Optimization with Graph Neural Networks	May 4, 2021	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 197 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified