Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5176–5200 of 15113 papers

Title	Date	Tasks	Status
Hybrid Information-driven Multi-agent Reinforcement Learning	Feb 1, 2021	ManagementMulti-agent Reinforcement Learning	—Unverified
Hybridization of evolutionary algorithm and deep reinforcement learning for multi-objective orienteering optimization	Jun 21, 2022	Deep Reinforcement LearningProblem Decomposition	—Unverified
Hybrid Learning for Orchestrating Deep Learning Inference in Multi-user Edge-cloud Networks	Feb 21, 2022	Cloud ComputingDeep Learning	—Unverified
Hybrid Learning with New Value Function for the Maximum Common Subgraph Problem	Aug 18, 2022	Reinforcement Learning (RL)	—Unverified
Hybrid Policies Using Inverse Rewards for Reinforcement Learning	Sep 27, 2018	OpenAI GymQ-Learning	—Unverified
Hybrid Q-Learning Applied to Ubiquitous recommender system	Mar 10, 2013	Q-LearningRecommendation Systems	—Unverified
Hybrid Reinforcement Learning and Model Predictive Control for Adaptive Control of Hydrogen-Diesel Dual-Fuel Combustion	Apr 23, 2025	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Hybrid Reinforcement Learning-Based Eco-Driving Strategy for Connected and Automated Vehicles at Signalized Intersections	Jan 19, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hybrid Reinforcement Learning Breaks Sample Size Barriers in Linear MDPs	Aug 8, 2024	Offline RLreinforcement-learning	—Unverified
Hybrid Reinforcement Learning for Optimizing Pump Sustainability in Real-World Water Distribution Networks	Oct 13, 2023	Reinforcement Learning (RL)Scheduling	—Unverified
Hybrid Reinforcement Learning for STAR-RISs: A Coupled Phase-Shift Model Based Beamformer	May 10, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Hybrid Reinforcement Learning Framework for Mixed-Variable Problems	May 30, 2024	Bayesian Optimizationreinforcement-learning	—Unverified
Hybrid Reinforcement Learning from Offline Observation Alone	Jun 11, 2024	reinforcement-learningReinforcement Learning	—Unverified
Hybrid Supervised and Reinforcement Learning for the Design and Optimization of Nanophotonic Structures	Sep 8, 2022	Computational Efficiencyreinforcement-learning	—Unverified
Hybrid Systems Neural Control with Region-of-Attraction Planner	Mar 18, 2023	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Mixed Traffic Control and Coordination from Pixels	Feb 17, 2023	Reinforcement Learning (RL)	—Unverified
Hybrid Transfer in Deep Reinforcement Learning for Ads Allocation	Apr 2, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hybrid UAV-enabled Secure Offloading via Deep Reinforcement Learning	Aug 16, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hybrid Value Estimation for Off-policy Evaluation and Offline Reinforcement Learning	Jun 4, 2022	MuJoCoOff-policy evaluation	—Unverified
Hybrid Zero Dynamics Inspired Feedback Control Policy Design for 3D Bipedal Locomotion using Reinforcement Learning	Oct 3, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Hyperbolically-Discounted Reinforcement Learning on Reward-Punishment Framework	Jun 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
Hyperbolic Deep Reinforcement Learning	Oct 4, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Hyperbolic Embeddings for Learning Options in Hierarchical Reinforcement Learning	Dec 4, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Hyper: Hyperparameter Robust Efficient Exploration in Reinforcement Learning	Dec 4, 2024	Efficient Explorationreinforcement-learning	—Unverified
HMRL: Hyper-Meta Learning for Sparse Reward Reinforcement Learning Problem	Feb 11, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 208 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified