Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4001–4050 of 15113 papers

Title	Date	Tasks	Status
Accelerating the Computation of UCB and Related Indices for Reinforcement Learning	Sep 28, 2019	reinforcement-learningReinforcement Learning	—Unverified
Accelerating the Learning of TAMER with Counterfactual Explanations	Aug 3, 2021	counterfactualreinforcement-learning	—Unverified
Accelerating Training in Pommerman with Imitation and Reinforcement Learning	Nov 12, 2019	Imitation Learningreinforcement-learning	—Unverified
Acceleration of Actor-Critic Deep Reinforcement Learning for Visual Grasping in Clutter by State Representation Learning Based on Disentanglement of a Raw Input Image	Feb 27, 2020	Deep Reinforcement LearningDisentanglement	—Unverified
AcceRL: Policy Acceleration Framework for Deep Reinforcement Learning	Nov 28, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Accidental exploration through value predictors	—	reinforcement-learningReinforcement Learning	—Unverified
ACCNet: Actor-Coordinator-Critic Net for "Learning-to-Communicate" with Deep Multi-agent Reinforcement Learning	Jun 10, 2017	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Accounting for the Sequential Nature of States to Learn Features for Reinforcement Learning	May 12, 2022	FormMetric Learning	—Unverified
Accuracy-Guaranteed Collaborative DNN Inference in Industrial IoT via Deep Reinforcement Learning	Dec 31, 2022	Deep Reinforcement LearningEdge-computing	—Unverified
ACDER: Augmented Curiosity-Driven Experience Replay	Nov 16, 2020	FetchPush-v1Reinforcement Learning (RL)	—Unverified
ACE: An Actor Ensemble Algorithm for Continuous Control with Tree Search	Nov 6, 2018	continuous-controlContinuous Control	—Unverified
ACECODER: Acing Coder RL via Automated Test-Case Synthesis	Feb 3, 2025	HumanEvalmbpp	—Unverified
A centralized reinforcement learning method for multi-agent job scheduling in Grid	Sep 11, 2016	reinforcement-learningReinforcement Learning	—Unverified
ACERAC: Efficient reinforcement learning in fine time discretization	Apr 8, 2021	reinforcement-learningReinforcement Learning	—Unverified
AceReason-Nemotron 1.1: Advancing Math and Code Reasoning through SFT and RL Synergy	Jun 16, 2025	MathReinforcement Learning (RL)	—Unverified
AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning	May 22, 2025	Mathreinforcement-learning	—Unverified
ACES -- Automatic Configuration of Energy Harvesting Sensors with Reinforcement Learning	Sep 4, 2019	reinforcement-learningReinforcement Learning	—Unverified
Achieving Fairness in Multi-Agent Markov Decision Processes Using Reinforcement Learning	Jun 1, 2023	FairnessOffline RL	—Unverified
Uniform Last-Iterate Guarantee for Bandits and Reinforcement Learning	Feb 20, 2024	reinforcement-learningReinforcement Learning	—Unverified
Achieving Real-Time LiDAR 3D Object Detection on a Mobile Device	Dec 26, 2020	3D Object DetectionAutonomous Driving	—Unverified
Achieving Tighter Finite-Time Rates for Heterogeneous Federated Stochastic Approximation under Markovian Sampling	Apr 15, 2025	Reinforcement Learning (RL)	—Unverified
Achieving Zero Constraint Violation for Constrained Reinforcement Learning via Primal-Dual Approach	Sep 13, 2021	Decision Makingreinforcement-learning	—Unverified
A Closer Look at Reward Decomposition for High-Level Robotic Explanations	Apr 25, 2023	Reinforcement Learning (RL)Vocal Bursts Intensity Prediction	—Unverified
ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning	Dec 22, 2024	D4RLQ-Learning	—Unverified
A Coarse to Fine Question Answering System based on Reinforcement Learning	Jun 1, 2021	Deep Reinforcement LearningQuestion Answering	—Unverified
A Cognitive Architecture Based on a Learning Classifier System with Spiking Classifiers	Aug 31, 2015	reinforcement-learningReinforcement Learning	—Unverified
A Collaborative Multi-agent Reinforcement Learning Framework for Dialog Action Decomposition	Nov 1, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
A note on stabilizing reinforcement learning	Nov 24, 2021	reinforcement-learningReinforcement Learning	—Unverified
A Communication-Efficient Multi-Agent Actor-Critic Algorithm for Distributed Reinforcement Learning	Jul 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Comparative Analysis of Deep Reinforcement Learning-enabled Freeway Decision-making for Automated Vehicles	Aug 4, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified
A Comparative Analysis of Expected and Distributional Reinforcement Learning	Jan 30, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
A Comparative Analysis of Machine Learning Techniques for IoT Intrusion Detection	Nov 25, 2021	Anomaly DetectionBIG-bench Machine Learning	—Unverified
A Comparative Analysis of Reinforcement Learning and Conventional Deep Learning Approaches for Bearing Fault Diagnosis	Jun 24, 2025	DiagnosticFault Diagnosis	—Unverified
A comparative evaluation of machine learning methods for robot navigation through human crowds	Dec 16, 2020	BIG-bench Machine LearningPrediction	—Unverified
A Comparative Study of AI-based Intrusion Detection Techniques in Critical Infrastructures	Jul 24, 2020	Intrusion DetectionManagement	—Unverified
A Comparative Study of Deep Reinforcement Learning for Crop Production Management	Nov 6, 2024	Deep Reinforcement LearningManagement	—Unverified
A Comparative Study of Reinforcement Learning Techniques on Dialogue Management	Apr 1, 2012	Dialogue ManagementManagement	—Unverified
A Comparison of Action Spaces for Learning Manipulation Tasks	Aug 23, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Comparison of Classical and Deep Reinforcement Learning Methods for HVAC Control	Aug 10, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
A comparison of controller architectures and learning mechanisms for arbitrary robot morphologies	Sep 25, 2023	Reinforcement Learning (RL)	—Unverified
A Comparison of learning algorithms on the Arcade Learning Environment	Oct 31, 2014	Atari Gamesreinforcement-learning	—Unverified
A Comparison of Prediction Algorithms and Nexting for Short Term Weather Forecasts	Mar 18, 2019	regressionReinforcement Learning	—Unverified
A Comparison of Reinforcement Learning Techniques for Fuzzy Cloud Auto-Scaling	May 19, 2017	ManagementQ-Learning	—Unverified
A Comparison of Self-Play Algorithms Under a Generalized Framework	Jun 8, 2020	Reinforcement Learning (RL)	—Unverified
A Complementary Learning Systems Approach to Temporal Difference Learning	May 7, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
A comprehensive survey of research towards AI-enabled unmanned aerial systems in pre-, active-, and post-wildfire management	Jan 4, 2024	ManagementReinforcement Learning (RL)	—Unverified
A Computational Framework for Motor Skill Acquisition	Jan 3, 2019	Decision MakingReinforcement Learning	—Unverified
A Computational Model of Representation Learning in the Brain Cortex, Integrating Unsupervised and Reinforcement Learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
A Conceptual Framework for Externally-influenced Agents: An Assisted Reinforcement Learning Review	Jul 3, 2020	Decision Makingreinforcement-learning	—Unverified
A Concise Introduction to Reinforcement Learning in Robotics	Oct 13, 2022	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 81 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified