Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4801–4825 of 15113 papers

Title	Date	Tasks	Status
A Primal-Dual Algorithm for Offline Constrained Reinforcement Learning with Linear MDPs	Feb 7, 2024	Offline RLReinforcement Learning (RL)	—Unverified
A Primal-Dual-Critic Algorithm for Offline Constrained Reinforcement Learning	Jun 13, 2023	reinforcement-learningReinforcement Learning	—Unverified
A Primer on Maximum Causal Entropy Inverse Reinforcement Learning	Mar 22, 2022	reinforcement-learningReinforcement Learning	—Unverified
A Principled Permutation Invariant Approach to Mean-Field Multi-Agent Reinforcement Learning	Sep 29, 2021	Inductive BiasMulti-agent Reinforcement Learning	—Unverified
A Privacy-preserving Distributed Training Framework for Cooperative Multi-agent Deep Reinforcement Learning	Sep 30, 2021	Deep Reinforcement LearningPrivacy Preserving	—Unverified
A Proposal: Interactively Learning to Summarise Timelines by Reinforcement Learning	Aug 1, 2021	Articlesreinforcement-learning	—Unverified
A Provable Approach for End-to-End Safe Reinforcement Learning	May 28, 2025	Gaussian ProcessesReinforcement Learning (RL)	—Unverified
A Provably Efficient Model-Free Posterior Sampling Method for Episodic Reinforcement Learning	Aug 23, 2022	Multi-Armed Banditsreinforcement-learning	—Unverified
A Provably Efficient Sample Collection Strategy for Reinforcement Learning	Jul 13, 2020	reinforcement-learningReinforcement Learning	—Unverified
APT: Adaptive Perceptual quality based camera Tuning using reinforcement learning	Nov 15, 2022	object-detectionObject Detection	—Unverified
A Quantum States Preparation Method Based on Difference-Driven Reinforcement Learning	Sep 29, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
AR3n: A Reinforcement Learning-based Assist-As-Needed Controller for Robotic Rehabilitation	Feb 28, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
A random measure approach to reinforcement learning in continuous time	Sep 25, 2024	reinforcement-learningReinforcement Learning	—Unverified
Arbitrage of Energy Storage in Electricity Markets with Deep Reinforcement Learning	Apr 28, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
ARC -- Actor Residual Critic for Adversarial Imitation Learning	Jun 5, 2022	ARCcontinuous-control	—Unverified
Arcades: A deep model for adaptive decision making in voice controlled smart-home	Jul 5, 2018	Decision MakingDeep Reinforcement Learning	—Unverified
Architecting and Visualizing Deep Reinforcement Learning Models	Dec 2, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Real-to-Sim-to-Real Approach to Robotic Manipulation with VLM-Generated Iterative Keypoint Rewards	Feb 12, 2025	Reinforcement Learning (RL)	—Unverified
A Real-World Quadrupedal Locomotion Benchmark for Offline Reinforcement Learning	Sep 13, 2023	Model Predictive Controlreinforcement-learning	—Unverified
Area-wide traffic signal control based on a deep graph Q-Network (DGQN) trained in an asynchronous manner	Aug 5, 2020	Reinforcement Learning (RL)Traffic Signal Control	—Unverified
A Reduction Approach to Constrained Reinforcement Learning	Jan 1, 2021	Diversityreinforcement-learning	—Unverified
A Reduction from Reinforcement Learning to No-Regret Online Learning	Nov 14, 2019	reinforcement-learningReinforcement Learning	—Unverified
Are Gradient-based Saliency Maps Useful in Deep Reinforcement Learning?	Dec 2, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
A Behavior Regularized Implicit Policy for Offline Reinforcement Learning	Feb 19, 2022	D4RLreinforcement-learning	—Unverified
A Regulation Enforcement Solution for Multi-agent Reinforcement Learning	Jan 29, 2019	AI AgentManagement	—Unverified

Show:10 25 50

← PrevPage 193 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified