Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4376–4400 of 15113 papers

Title	Date	Tasks	Status
Adviser-Actor-Critic: Eliminating Steady-State Error in Reinforcement Learning Control	Feb 4, 2025	Reinforcement Learning (RL)	—Unverified
A dynamic game approach to training robust deep policies	Jan 1, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Dynamics Perspective of Pursuit-Evasion Games of Intelligent Agents with the Ability to Learn	Apr 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
AED: Automatic Discovery of Effective and Diverse Vulnerabilities for Autonomous Driving Policy with Large Language Models	Mar 24, 2025	Autonomous DrivingReinforcement Learning (RL)	—Unverified
Aerial Base Station Positioning and Power Control for Securing Communications: A Deep Q-Network Approach	Dec 21, 2021	PositionQ-Learning	—Unverified
Aesthetic Photo Collage with Deep Reinforcement Learning	Oct 19, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Fair Federated Learning Framework With Reinforcement Learning	May 26, 2022	FairnessFederated Learning	—Unverified
A Family of Cognitively Realistic Parsing Environments for Deep Reinforcement Learning	Jan 16, 2022	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
A Family of Robust Stochastic Operators for Reinforcement Learning	Dec 1, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Federated Reinforcement Learning Framework for Link Activation in Multi-link Wi-Fi Networks	Apr 28, 2023	Fairnessreinforcement-learning	—Unverified
A Federated Reinforcement Learning Method with Quantization for Cooperative Edge Caching in Fog Radio Access Networks	Jun 23, 2022	Deep Reinforcement LearningQuantization	—Unverified
A Few Expert Queries Suffices for Sample-Efficient RL with Resets and Linear Value Approximation	Jul 18, 2022	Imitation LearningReinforcement Learning (RL)	—Unverified
Affordance as general value function: A computational model	Oct 27, 2020	Autonomous Drivingmodel	—Unverified
Affordance-based Reinforcement Learning for Urban Driving	Jan 15, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Affordance-Guided Reinforcement Learning via Visual Prompting	Jul 14, 2024	reinforcement-learningReinforcement Learning	—Unverified
A Finite-Sample Analysis of Distributionally Robust Average-Reward Reinforcement Learning	May 18, 2025	Reinforcement Learning (RL)	—Unverified
A finite time analysis of distributed Q-learning	May 23, 2024	Decision MakingMulti-agent Reinforcement Learning	—Unverified
A Finite-Time Analysis of Q-Learning with Neural Network Function Approximation	Dec 10, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
A First-Occupancy Representation for Reinforcement Learning	Sep 28, 2021	reinforcement-learningReinforcement Learning	—Unverified
A Flexible Measurement of Diversity in Datasets with Random Network Distillation	Sep 29, 2021	DiversityImage Generation	—Unverified
A Framework and Method for Online Inverse Reinforcement Learning	May 21, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Framework for Constrained and Adaptive Behavior-Based Agents	Jun 7, 2015	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Scaling data-driven robotics with reward sketching and batch reinforcement learning	Sep 26, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Framework for dynamically meeting performance objectives on a service mesh	Jun 25, 2023	ManagementReinforcement Learning (RL)	—Unverified
Learning Visual Robotic Control Efficiently with Contrastive Pre-training and Data Augmentation	Dec 14, 2020	Data Augmentationreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 176 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified