Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5151–5200 of 15113 papers

Title	Date	Tasks	Status
Human-in-the-loop: Provably Efficient Preference-based Reinforcement Learning with General Function Approximation	May 23, 2022	Reinforcement Learning (RL)	—Unverified
Human-in-the-loop Reinforcement Learning for Data Quality Monitoring in Particle Physics Experiments	May 24, 2024	Data AugmentationReinforcement Learning (RL)	—Unverified
Humanizing the Machine: Proxy Attacks to Mislead LLM Detectors	Oct 25, 2024	Reinforcement Learning (RL)Small Language Model	—Unverified
Human-level performance in first-person multiplayer games with population-based deep reinforcement learning	Jul 3, 2018	Deep Reinforcement LearningReinforcement Learning	—Unverified
Human-Level Reinforcement Learning through Theory-Based Modeling, Exploration, and Planning	Jul 27, 2021	Bayesian InferenceBoard Games	—Unverified
Human-Like Autonomous Car-Following Model with Deep Reinforcement Learning	Jan 3, 2019	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Human-Like Decision Making: Document-level Aspect Sentiment Classification via Hierarchical Reinforcement Learning	Oct 21, 2019	Decision MakingGeneral Classification	—Unverified
Human-like Energy Management Based on Deep Reinforcement Learning and Historical Driving Experiences	Jul 16, 2020	Deep Reinforcement Learningenergy management	—Unverified
Human-Object Interaction from Human-Level Instructions	Jun 25, 2024	Common Sense ReasoningHuman-Object Interaction Detection	—Unverified
Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning	Feb 24, 2025	Reinforcement Learning (RL)	—Unverified
Human-Robot Skill Transfer with Enhanced Compliance via Dynamic Movement Primitives	Apr 12, 2023	Reinforcement Learning (RL)Trajectory Planning	—Unverified
Humans are not Boltzmann Distributions: Challenges and Opportunities for Modelling Human Feedback and Interaction in Reinforcement Learning	Jun 27, 2022	Reinforcement Learning (RL)	—Unverified
Human-Timescale Adaptation in an Open-Ended Task Space	Jan 18, 2023	In-Context LearningMeta Reinforcement Learning	—Unverified
Machine versus Human Attention in Deep Reinforcement Learning Tasks	Oct 29, 2020	Atari GamesDeep Reinforcement Learning	—Unverified
Hundreds Guide Millions: Adaptive Offline Reinforcement Learning with Expert Guidance	Sep 4, 2023	Offline RLreinforcement-learning	—Unverified
HVAC-DPT: A Decision Pretrained Transformer for HVAC Control	Nov 29, 2024	In-Context Reinforcement LearningReinforcement Learning (RL)	—Unverified
HyAR: Addressing Discrete-Continuous Action Reinforcement Learning via Hybrid Action Representation	Sep 12, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Hybrid Action Based Reinforcement Learning for Multi-Objective Compatible Autonomous Driving	Jan 14, 2025	AttributeAutonomous Driving	—Unverified
Hybrid Adversarial Imitation Learning	Feb 4, 2021	Imitation LearningReinforcement Learning (RL)	—Unverified
Hybrid Beamforming for mmWave MU-MISO Systems Exploiting Multi-agent Deep Reinforcement Learning	Feb 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hybrid computer approach to train a machine learning system	Mar 13, 2021	BIG-bench Machine Learningreinforcement-learning	—Unverified
Hybrid Cross-domain Robust Reinforcement Learning	May 29, 2025	reinforcement-learningReinforcement Learning	—Unverified
Hybrid Deep Reinforcement Learning and Planning for Safe and Comfortable Automated Driving	Dec 30, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hybrid Imitation Learning for Real-Time Service Restoration in Resilient Distribution Systems	Nov 29, 2020	Imitation LearningReinforcement Learning (RL)	—Unverified
Hybrid Indoor Localization via Reinforcement Learning-based Information Fusion	Oct 27, 2022	Decision MakingIndoor Localization	—Unverified
Hybrid Information-driven Multi-agent Reinforcement Learning	Feb 1, 2021	ManagementMulti-agent Reinforcement Learning	—Unverified
Hybridization of evolutionary algorithm and deep reinforcement learning for multi-objective orienteering optimization	Jun 21, 2022	Deep Reinforcement LearningProblem Decomposition	—Unverified
Hybrid Learning for Orchestrating Deep Learning Inference in Multi-user Edge-cloud Networks	Feb 21, 2022	Cloud ComputingDeep Learning	—Unverified
Hybrid Learning with New Value Function for the Maximum Common Subgraph Problem	Aug 18, 2022	Reinforcement Learning (RL)	—Unverified
Hybrid Policies Using Inverse Rewards for Reinforcement Learning	Sep 27, 2018	OpenAI GymQ-Learning	—Unverified
Hybrid Q-Learning Applied to Ubiquitous recommender system	Mar 10, 2013	Q-LearningRecommendation Systems	—Unverified
Hybrid Reinforcement Learning and Model Predictive Control for Adaptive Control of Hydrogen-Diesel Dual-Fuel Combustion	Apr 23, 2025	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Hybrid Reinforcement Learning-Based Eco-Driving Strategy for Connected and Automated Vehicles at Signalized Intersections	Jan 19, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hybrid Reinforcement Learning Breaks Sample Size Barriers in Linear MDPs	Aug 8, 2024	Offline RLreinforcement-learning	—Unverified
Hybrid Reinforcement Learning for Optimizing Pump Sustainability in Real-World Water Distribution Networks	Oct 13, 2023	Reinforcement Learning (RL)Scheduling	—Unverified
Hybrid Reinforcement Learning for STAR-RISs: A Coupled Phase-Shift Model Based Beamformer	May 10, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Hybrid Reinforcement Learning Framework for Mixed-Variable Problems	May 30, 2024	Bayesian Optimizationreinforcement-learning	—Unverified
Hybrid Reinforcement Learning from Offline Observation Alone	Jun 11, 2024	reinforcement-learningReinforcement Learning	—Unverified
Hybrid Supervised and Reinforcement Learning for the Design and Optimization of Nanophotonic Structures	Sep 8, 2022	Computational Efficiencyreinforcement-learning	—Unverified
Hybrid Systems Neural Control with Region-of-Attraction Planner	Mar 18, 2023	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Mixed Traffic Control and Coordination from Pixels	Feb 17, 2023	Reinforcement Learning (RL)	—Unverified
Hybrid Transfer in Deep Reinforcement Learning for Ads Allocation	Apr 2, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hybrid UAV-enabled Secure Offloading via Deep Reinforcement Learning	Aug 16, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hybrid Value Estimation for Off-policy Evaluation and Offline Reinforcement Learning	Jun 4, 2022	MuJoCoOff-policy evaluation	—Unverified
Hybrid Zero Dynamics Inspired Feedback Control Policy Design for 3D Bipedal Locomotion using Reinforcement Learning	Oct 3, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Hyperbolically-Discounted Reinforcement Learning on Reward-Punishment Framework	Jun 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
Hyperbolic Deep Reinforcement Learning	Oct 4, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Hyperbolic Embeddings for Learning Options in Hierarchical Reinforcement Learning	Dec 4, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Hyper: Hyperparameter Robust Efficient Exploration in Reinforcement Learning	Dec 4, 2024	Efficient Explorationreinforcement-learning	—Unverified
HMRL: Hyper-Meta Learning for Sparse Reward Reinforcement Learning Problem	Feb 11, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 104 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified