Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4901–4950 of 15113 papers

Title	Date	Tasks	Status
A Review of Tracking, Prediction and Decision Making Methods for Autonomous Driving	Sep 17, 2019	Autonomous DrivingDecision Making	—Unverified
A Review of Uncertainty for Deep Reinforcement Learning	Aug 18, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Review of Uncertainty Quantification in Deep Learning: Techniques, Applications and Challenges	Nov 12, 2020	Decision MakingEnsemble Learning	—Unverified
Car-Following Models: A Multidisciplinary Review	Apr 14, 2023	Imitation Learningreinforcement-learning	—Unverified
Argumentative Reward Learning: Reasoning About Human Preferences	Sep 28, 2022	reinforcement-learningReinforcement Learning	—Unverified
Argus: Smartphone-enabled Human Cooperation via Multi-Agent Reinforcement Learning for Disaster Situational Awareness	Apr 29, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
ARIA: Training Language Agents with Intention-Driven Reward Aggregation	May 31, 2025	Decision MakingReinforcement Learning (RL)	—Unverified
A Policy Optimization Method Towards Optimal-time Stability	Jan 2, 2023	Reinforcement Learning (RL)	—Unverified
A Roadmap Towards Improving Multi-Agent Reinforcement Learning With Causal Discovery And Inference	Mar 22, 2025	Causal DiscoveryMulti-agent Reinforcement Learning	—Unverified
A Robotic Model of Hippocampal Reverse Replay for Reinforcement Learning	Feb 23, 2021	Hippocampusreinforcement-learning	—Unverified
A Robust and Constrained Multi-Agent Reinforcement Learning Electric Vehicle Rebalancing Method in AMoD Systems	Sep 17, 2022	FairnessMulti-agent Reinforcement Learning	—Unverified
A Robust Fuel Optimization Strategy For Hybrid Electric Vehicles: A Deep Reinforcement Learning Based Continuous Time Design Approach	Jan 1, 2021	Deep Reinforcement LearningManagement	—Unverified
ArrayBot: Reinforcement Learning for Generalizable Distributed Manipulation through Touch	Jun 29, 2023	reinforcement-learningReinforcement Learning	—Unverified
Artificial Intelligence Approaches To UCAV Autonomy	Jan 24, 2017	reinforcement-learningReinforcement Learning	—Unverified
Artificial Intelligence as Structural Estimation: Economic Interpretations of Deep Blue, Bonanza, and AlphaGo	Oct 30, 2017	EconometricsReinforcement Learning	—Unverified
Artificial Intelligence-based Decision Support Systems for Precision and Digital Health	Jul 22, 2024	Reinforcement Learning (RL)	—Unverified
Artificial Intelligence in Vehicular Wireless Networks: A Case Study Using ns-3	Mar 10, 2022	Reinforcement Learning (RL)	—Unverified
A Safe Hierarchical Planning Framework for Complex Driving Scenarios based on Reinforcement Learning	Jan 17, 2021	Autonomous Vehiclesreinforcement-learning	—Unverified
A Safe Reinforcement Learning Algorithm for Supervisory Control of Power Plants	Jan 23, 2024	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Safe Reinforcement Learning driven Weights-varying Model Predictive Control for Autonomous Vehicle Motion Control	Feb 4, 2024	Bayesian OptimizationDeep Reinforcement Learning	—Unverified
Safe Model-Based Reinforcement Learning for Systems with Parametric Uncertainties	Jul 24, 2020	Model-based Reinforcement Learningreinforcement-learning	—Unverified
A Safety Modulator Actor-Critic Method in Model-Free Safe Reinforcement Learning and Application in UAV Hovering	Oct 9, 2024	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
A Scalable Deep Reinforcement Learning Model for Online Scheduling Coflows of Multi-Stage Jobs for High Performance Computing	Dec 21, 2021	Deep Reinforcement LearningGraph Neural Network	—Unverified
A Scalable Finite Difference Method for Deep Reinforcement Learning	Oct 14, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Distributed Multi-Agent Reinforcement Learning Based on Graph-Induced Local Value Functions	Feb 26, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
A Scalable Reinforcement Learning Approach for Attack Allocation in Swarm to Swarm Engagement Problems	Oct 15, 2022	Reinforcement Learning (RL)	—Unverified
A Scalable Reinforcement Learning-based System Using On-Chain Data for Cryptocurrency Portfolio Management	Jul 4, 2023	ManagementReinforcement Learning (RL)	—Unverified
A Scale-Independent Multi-Objective Reinforcement Learning with Convergence Analysis	Feb 8, 2023	Decision MakingMulti-Objective Reinforcement Learning	—Unverified
A Secure Learning Control Strategy via Dynamic Camouflaging for Unknown Dynamical Systems under Attacks	Feb 1, 2021	Misinformationreinforcement-learning	—Unverified
A Sensorimotor Reinforcement Learning Framework for Physical Human-Robot Interaction	Jul 27, 2016	Bayesian OptimizationGaussian Processes	—Unverified
A storage expansion planning framework using reinforcement learning and simulation-based optimization	Jan 10, 2020	Decision MakingQ-Learning	—Unverified
ASHA: Assistive Teleoperation via Human-in-the-Loop Reinforcement Learning	Feb 5, 2022	reinforcement-learningReinforcement Learning	—Unverified
A Sharp Analysis of Model-based Reinforcement Learning with Self-Play	Oct 4, 2020	Model-based Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
A Complete Characterization of Linear Estimators for Offline Policy Evaluation	Mar 8, 2022	Decision Makingreinforcement-learning	—Unverified
A Short Note on Soft-max and Policy Gradients in Bandits Problems	Jul 20, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Short Note on the Relationship of Information Gain and Eluder Dimension	Jul 6, 2021	LEMMAreinforcement-learning	—Unverified
A Short Survey On Memory Based Reinforcement Learning	Apr 14, 2019	Decision Makingreinforcement-learning	—Unverified
A Short Survey on Probabilistic Reinforcement Learning	Jan 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
A short variational proof of equivalence between policy gradients and soft Q learning	Dec 22, 2017	Q-Learningreinforcement-learning	—Unverified
A Shoulder to Cry on: Towards A Motivational Virtual Assistant for Assuaging Mental Agony	Jul 1, 2022	Dialogue GenerationReinforcement Learning (RL)	—Unverified
A Signaling Game Approach to Databases Querying and Interaction	Mar 13, 2016	Data InteractionManagement	—Unverified
A Simple Imitation Learning Method via Contrastive Regularization	May 16, 2020	Atari GamesImitation Learning	—Unverified
A Simple Reinforcement Learning Mechanism for Resource Allocation in LTE-A Networks with Markov Decision Process and Q-Learning	Sep 27, 2017	Q-Learningreinforcement-learning	—Unverified
A Simple Reward-free Approach to Constrained Reinforcement Learning	Jul 12, 2021	Diversityreinforcement-learning	—Unverified
A Simple Sparse Denoising Layer for Robust Deep Learning	Jan 1, 2021	Deep LearningDenoising	—Unverified
A Distance-based Anomaly Detection Framework for Deep Reinforcement Learning	Sep 21, 2021	Anomaly DetectionAtari Games	—Unverified
A Simple Unified Uncertainty-Guided Framework for Offline-to-Online Reinforcement Learning	Jun 13, 2023	D4RLEfficient Exploration	—Unverified
Novelty Detection in Reinforcement Learning with World Models	Oct 12, 2023	Decision MakingNovelty Detection	—Unverified
A Single-Timescale Analysis For Stochastic Approximation With Multiple Coupled Sequences	Jun 21, 2022	Reinforcement Learning (RL)	—Unverified
Ask1: Development and Reinforcement Learning-Based Control of a Custom Quadruped Robot	Dec 11, 2024	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 99 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified