Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2351–2400 of 15113 papers

Title	Date	Tasks	Status
A Comparison of Reinforcement Learning Techniques for Fuzzy Cloud Auto-Scaling	May 19, 2017	ManagementQ-Learning	—Unverified
Constraining Action Sequences with Formal Languages for Deep Reinforcement Learning	Sep 27, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Bayesian Controller Fusion: Leveraging Control Priors in Deep Reinforcement Learning for Robotics	Jul 21, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Bayesian Bellman Operators	Jun 9, 2021	continuous-controlContinuous Control	—Unverified
An agent-driven semantical identifier using radial basis neural networks and reinforcement learning	Sep 30, 2014	Authorship AttributionInformation Retrieval	—Unverified
An Affective Robot Companion for Assisting the Elderly in a Cognitive Game Scenario	Jul 12, 2018	Decision MakingDialogue Management	—Unverified
Adaptive Stress Testing for Adversarial Learning in a Financial Environment	Jul 8, 2021	Fraud Detectionregression	—Unverified
Constrained Upper Confidence Reinforcement Learning	Jan 26, 2020	reinforcement-learningReinforcement Learning	—Unverified
Battery Model Calibration with Deep Reinforcement Learning	Dec 7, 2020	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
An advantage based policy transfer algorithm for reinforcement learning with measures of transferability	Nov 12, 2023	continuous-controlContinuous Control	—Unverified
BATS: Best Action Trajectory Stitching	Apr 26, 2022	reinforcement-learningReinforcement Learning	—Unverified
An adaptive synchronization approach for weights of deep reinforcement learning	Aug 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Stress Testing: Finding Likely Failure Events with Reinforcement Learning	Nov 6, 2018	Autonomous DrivingCollision Avoidance	—Unverified
Constrained Upper Confidence Reinforcement Learning with Known Dynamics	Jun 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Constraint-Conditioned Policy Optimization for Versatile Safe Reinforcement Learning	Oct 5, 2023	reinforcement-learningReinforcement Learning	—Unverified
Context-aware taxi dispatching at city-scale using deep reinforcement learning	May 26, 2021	Action GenerationDeep Reinforcement Learning	—Unverified
Batch Reinforcement Learning with a Nonparametric Off-Policy Policy Gradient	Oct 27, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified
Batch Reinforcement Learning with Hyperparameter Gradients	Jan 1, 2020	continuous-controlContinuous Control	—Unverified
An Adaptive Multi-Agent Physical Layer Security Framework for Cognitive Cyber-Physical Systems	Jan 7, 2021	Reinforcement Learning (RL)	—Unverified
Batch Reinforcement Learning Through Continuation Method	Jan 1, 2021	global-optimizationreinforcement-learning	—Unverified
Batch Reinforcement Learning on the Industrial Benchmark: First Experiences	May 20, 2017	reinforcement-learningReinforcement Learning	—Unverified
An Adaptable Approach to Learn Realistic Legged Locomotion without Examples	Oct 28, 2021	Reinforcement Learning (RL)	—Unverified
Adaptive Stochastic Nonlinear Model Predictive Control with Look-ahead Deep Reinforcement Learning for Autonomous Vehicle Motion Control	Nov 7, 2023	Decision MakingDeep Reinforcement Learning	—Unverified
Batch Reinforcement Learning from Crowds	Nov 8, 2021	reinforcement-learningReinforcement Learning	—Unverified
Batch Recurrent Q-Learning for Backchannel Generation Towards Engaging Agents	Aug 6, 2019	Imitation LearningQ-Learning	—Unverified
An A* Curriculum Approach to Reinforcement Learning for RGBD Indoor Robot Navigation	Jan 5, 2021	Deep Reinforcement LearningGPU	—Unverified
Batch Policy Gradient Methods for Improving Neural Conversation Models	Feb 10, 2017	ChatbotPolicy Gradient Methods	—Unverified
Learning "What-if" Explanations for Sequential Decision-Making	Jul 2, 2020	counterfactualCounterfactual Reasoning	—Unverified
An Actor-Critic Method for Simulation-Based Optimization	Oct 31, 2021	Adversarial AttackReinforcement Learning (RL)	—Unverified
Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in Edge Industrial IoT	Jun 30, 2021	Decision MakingEdge-computing	—Unverified
A Comparison of Prediction Algorithms and Nexting for Short Term Weather Forecasts	Mar 18, 2019	regressionReinforcement Learning	—Unverified
Batch Ensemble for Variance Dependent Regret in Stochastic Bandits	Sep 13, 2024	Multi-Armed BanditsReinforcement Learning (RL)	—Unverified
An Actor-Critic-Attention Mechanism for Deep Reinforcement Learning in Multi-view Environments	Jul 19, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Batch-Constrained Reinforcement Learning for Dynamic Distribution Network Reconfiguration	Jun 23, 2020	reinforcement-learningReinforcement Learning	—Unverified
Batch-Constrained Distributional Reinforcement Learning for Session-based Recommendation	Dec 16, 2020	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Adaptive Shooting for Bots in First Person Shooter Games Using Reinforcement Learning	Jun 14, 2018	reinforcement-learningReinforcement Learning	—Unverified
Batch-Augmented Multi-Agent Reinforcement Learning for Efficient Traffic Signal Optimization	May 19, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
An Abstraction-based Method to Check Multi-Agent Deep Reinforcement-Learning Behaviors	Feb 2, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Basic protocols in quantum reinforcement learning with superconducting circuits	Jan 18, 2017	BIG-bench Machine LearningQuantum Machine Learning	—Unverified
Baselines for Reinforcement Learning in Text Games	Nov 7, 2018	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Selection of Informative Path Planning Strategies via Reinforcement Learning	Aug 14, 2021	GPRPrediction	—Unverified
A Comparison of learning algorithms on the Arcade Learning Environment	Oct 31, 2014	Atari Gamesreinforcement-learning	—Unverified
Constrained-Space Optimization and Reinforcement Learning for Complex Tasks	Apr 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Basal Glucose Control in Type 1 Diabetes using Deep Reinforcement Learning: An In Silico Validation	May 18, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Basal-Bolus Advisor for Type 1 Diabetes (T1D) Patients Using Multi-Agent Reinforcement Learning (RL) Methodology	Jul 17, 2023	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Barrier Function-based Safe Reinforcement Learning for Emergency Control of Power Systems	Mar 26, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Multi-Objective Deep Reinforcement Learning Framework	Mar 8, 2018	Deep Reinforcement LearningMulti-Objective Reinforcement Learning	—Unverified
Adaptive Security Policy Management in Cloud Environments Using Reinforcement Learning	May 13, 2025	Deep Reinforcement LearningIntrusion Detection	—Unverified
Barrier-Certified Adaptive Reinforcement Learning with Applications to Brushbot Navigation	Jan 29, 2018	reinforcement-learningReinforcement Learning	—Unverified
BARReL: Bottleneck Attention for Adversarial Robustness in Vision-Based Reinforcement Learning	Aug 22, 2022	Adversarial Robustnessreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 48 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified