Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3201–3225 of 15113 papers

Title	Date	Tasks	Status
Credit-cognisant reinforcement learning for multi-agent cooperation	Nov 18, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Asymmetric REINFORCE for off-Policy Reinforcement Learning: Balancing positive and negative rewards	Jun 25, 2025	Reinforcement Learning (RL)	—Unverified
Asymptotically Efficient Off-Policy Evaluation for Tabular Reinforcement Learning	Jan 29, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Credit Assignment with Meta-Policy Gradient for Multi-Agent Reinforcement Learning	Feb 24, 2021	Meta-LearningMulti-agent Reinforcement Learning	—Unverified
Data-Assimilated Model-Based Reinforcement Learning for Partially Observed Chaotic Flows	Apr 23, 2025	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
Data-assimilated model-informed reinforcement learning	Jun 2, 2025	modelreinforcement-learning	—Unverified
Asymptotic Instance-Optimal Algorithms for Interactive Decision Making	Jun 6, 2022	Decision MakingMulti-Armed Bandits	—Unverified
Data Augmentation for Continual RL via Adversarial Gradient Episodic Memory	Aug 24, 2024	BenchmarkingData Augmentation	—Unverified
Data Boost: Text Data Augmentation Through Reinforcement Learning Guided Conditional Generation	Dec 5, 2020	Data Augmentationreinforcement-learning	—Unverified
Data Center Cooling System Optimization Using Offline Reinforcement Learning	Jan 25, 2025	Graph Neural NetworkOffline RL	—Unverified
Asymptotics of Reinforcement Learning with Neural Networks	Nov 13, 2019	Q-Learningreinforcement-learning	—Unverified
Data Cross-Segmentation for Improved Generalization in Reinforcement Learning Based Algorithmic Trading	Jul 18, 2023	Algorithmic Tradingreinforcement-learning	—Unverified
Data Distillation for Controlling Specificity in Dialogue Generation	Feb 22, 2017	Dialogue Generationreinforcement-learning	—Unverified
Asynchronous Actor-Critic for Multi-Agent Reinforcement Learning	Sep 20, 2022	Decision MakingMulti-agent Reinforcement Learning	—Unverified
A Survey of Continual Reinforcement Learning	Jun 27, 2025	Continual LearningDecision Making	—Unverified
Data-driven control of COVID-19 in buildings: a reinforcement-learning approach	Dec 27, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Data-driven control of micro-climate in buildings: an event-triggered reinforcement learning approach	Jan 28, 2020	Decision MakingReinforcement Learning	—Unverified
Data-driven control of spatiotemporal chaos with reduced-order neural ODE-based models and reinforcement learning	May 1, 2022	Deep Reinforcement LearningDimensionality Reduction	—Unverified
Data-driven Dynamic Multi-objective Optimal Control: An Aspiration-satisfying Reinforcement Learning Approach	May 14, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
Data-driven End-to-end Learning of Pole Placement Control for Nonlinear Dynamics via Koopman Invariant Subspaces	Aug 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Data-Driven Evaluation of Training Action Space for Reinforcement Learning	Apr 8, 2022	reinforcement-learningReinforcement Learning	—Unverified
Data-Driven H-infinity Control with a Real-Time and Efficient Reinforcement Learning Algorithm: An Application to Autonomous Mobility-on-Demand Systems	Sep 16, 2023	Q-LearningReinforcement Learning (RL)	—Unverified
Data-driven Integrated Sensing and Communication: Recent Advances, Challenges, and Future Prospects	Aug 17, 2023	Integrated sensing and communicationISAC	—Unverified
Data-Driven Inverse Reinforcement Learning for Expert-Learner Zero-Sum Games	Jan 5, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Adam on Local Time: Addressing Nonstationarity in RL with Relative Adam Timesteps	Dec 22, 2024	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 129 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified