Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2351–2375 of 15113 papers

Title	Date	Tasks	Status
Bayesian Critique-Tune-Based Reinforcement Learning with Adaptive Pressure for Multi-Intersection Traffic Signal Control	Dec 18, 2024	Bayesian Inferencereinforcement-learning	—Unverified
A Comparison of Reinforcement Learning Techniques for Fuzzy Cloud Auto-Scaling	May 19, 2017	ManagementQ-Learning	—Unverified
Constrained Attractor Selection Using Deep Reinforcement Learning	Sep 23, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Constrained Combinatorial Optimization with Reinforcement Learning	Jun 22, 2020	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Bayesian Controller Fusion: Leveraging Control Priors in Deep Reinforcement Learning for Robotics	Jul 21, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Bayesian Bellman Operators	Jun 9, 2021	continuous-controlContinuous Control	—Unverified
An agent-driven semantical identifier using radial basis neural networks and reinforcement learning	Sep 30, 2014	Authorship AttributionInformation Retrieval	—Unverified
An Affective Robot Companion for Assisting the Elderly in a Cognitive Game Scenario	Jul 12, 2018	Decision MakingDialogue Management	—Unverified
Adaptive Stress Testing for Adversarial Learning in a Financial Environment	Jul 8, 2021	Fraud Detectionregression	—Unverified
Consolidation via Policy Information Regularization in Deep RL for Multi-Agent Games	Nov 23, 2020	Continual Learningcontinuous-control	—Unverified
Battery Model Calibration with Deep Reinforcement Learning	Dec 7, 2020	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
An advantage based policy transfer algorithm for reinforcement learning with measures of transferability	Nov 12, 2023	continuous-controlContinuous Control	—Unverified
BATS: Best Action Trajectory Stitching	Apr 26, 2022	reinforcement-learningReinforcement Learning	—Unverified
An adaptive synchronization approach for weights of deep reinforcement learning	Aug 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Stress Testing: Finding Likely Failure Events with Reinforcement Learning	Nov 6, 2018	Autonomous DrivingCollision Avoidance	—Unverified
Constant Stepsize Q-learning: Distributional Convergence, Bias and Extrapolation	Jan 25, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Constrained Cross-Entropy Method for Safe Reinforcement Learning	Dec 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Constrained Reinforcement Learning for Short Video Recommendation	May 26, 2022	Recommendation Systemsreinforcement-learning	—Unverified
Constrained Text Generation with Global Guidance -- Case Study on CommonGen	Mar 12, 2021	Common Sense Reasoningreinforcement-learning	—Unverified
Batch Reinforcement Learning with a Nonparametric Off-Policy Policy Gradient	Oct 27, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified
Batch Reinforcement Learning with Hyperparameter Gradients	Jan 1, 2020	continuous-controlContinuous Control	—Unverified
An Adaptive Multi-Agent Physical Layer Security Framework for Cognitive Cyber-Physical Systems	Jan 7, 2021	Reinforcement Learning (RL)	—Unverified
Batch Reinforcement Learning Through Continuation Method	Jan 1, 2021	global-optimizationreinforcement-learning	—Unverified
Batch Reinforcement Learning on the Industrial Benchmark: First Experiences	May 20, 2017	reinforcement-learningReinforcement Learning	—Unverified
An Adaptable Approach to Learn Realistic Legged Locomotion without Examples	Oct 28, 2021	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 95 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified