Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 676–700 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Comparing Deep Reinforcement Learning Algorithms in Two-Echelon Supply Chains	Apr 20, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1	5
Asynchronous Methods for Deep Reinforcement Learning	Feb 4, 2016	Atari GamesCPU	CodeCode Available	1	5
Adversarial Search and Tracking with Multiagent Reinforcement Learning in Sparsely Observable Environment	Jun 20, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1	5
Deep Reinforcement Learning for Conservation Decisions	Jun 15, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	CodeCode Available	1	5
Attention Actor-Critic algorithm for Multi-Agent Constrained Co-operative Reinforcement Learning	Jan 7, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1	5
Deep Reinforcement Learning for List-wise Recommendations	Dec 30, 2017	Deep Reinforcement LearningRecommendation Systems	CodeCode Available	1	5
Adversarial Soft Advantage Fitting: Imitation Learning without Policy Optimization	Jun 23, 2020	Imitation Learningreinforcement-learning	CodeCode Available	1	5
Attacking Video Recognition Models with Bullet-Screen Comments	Oct 29, 2021	Adversarial AttackAdversarial Attack on Video Classification	CodeCode Available	1	5
Deep Reinforcement Learning for Joint Spectrum and Power Allocation in Cellular Networks	Dec 19, 2020	Deep Reinforcement LearningManagement	CodeCode Available	1	5
A Traffic Light Dynamic Control Algorithm with Deep Reinforcement Learning Based on GNN Prediction	Sep 29, 2020	Deep Reinforcement LearningGraph Neural Network	CodeCode Available	1	5
Attacking Cooperative Multi-Agent Reinforcement Learning by Adversarial Minority Influence	Feb 7, 2023	Continuous ControlMuJoCo	CodeCode Available	1	5
Deep Reinforcement Learning for Resource Allocation in Business Processes	Mar 29, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Augmenting Policy Learning with Routines Discovered from a Single Demonstration	Dec 23, 2020	Atari GamesImitation Learning	CodeCode Available	1	5
Attractive or Faithful? Popularity-Reinforced Learning for Inspired Headline Generation	Feb 6, 2020	ArticlesHeadline Generation	CodeCode Available	1	5
Deep reinforcement learning-designed radiofrequency waveform in MRI	May 7, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Active Reinforcement Learning for Robust Building Control	Dec 16, 2023	Atari GamesGame of Go	CodeCode Available	1	5
Augmenting Reinforcement Learning with Behavior Primitives for Diverse Manipulation Tasks	Oct 7, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
A Unified Approach to Reinforcement Learning, Quantal Response Equilibria, and Two-Player Zero-Sum Games	Jun 12, 2022	Deep Reinforcement LearningMuJoCo Games	CodeCode Available	1	5
Aerial View Localization with Reinforcement Learning: Towards Emulating Search-and-Rescue	Sep 8, 2022	Heuristic Searchreinforcement-learning	CodeCode Available	1	5
Accelerating lifelong reinforcement learning via reshaping rewards	Oct 17, 2021	Lifelong learningreinforcement-learning	CodeCode Available	1	5
Adversarial Policies: Attacking Deep Reinforcement Learning	May 25, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Deep Reinforcement Learning in Parameterized Action Space	Nov 13, 2015	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Deep Reinforcement Learning Control of Quantum Cartpoles	Oct 21, 2019	Deep LearningDeep Reinforcement Learning	CodeCode Available	1	5
A fast balance optimization approach for charging enhancement of lithium-ion battery packs through deep reinforcement learning	Apr 24, 2024	Deep Reinforcement Learningenergy management	CodeCode Available	1	5
Deep Reinforcement Learning based Group Recommender System	Jun 13, 2021	Deep Reinforcement LearningRecommendation Systems	CodeCode Available	1	5

Show:10 25 50

← PrevPage 28 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified