Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1476–1500 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Forgetful Experience Replay in Hierarchical Reinforcement Learning from Demonstrations	Jun 17, 2020	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	1	5
Lyapunov-Regularized Reinforcement Learning for Power System Transient Stability	Mar 5, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Basis for Intentions: Efficient Inverse Reinforcement Learning using Past Experience	Aug 9, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Age-Based Scheduling for Mobile Edge Computing: A Deep Reinforcement Learning Approach	Dec 1, 2023	Deep Reinforcement LearningEdge-computing	CodeCode Available	1	5
Deep Reinforcement Learning for Process Synthesis	Sep 23, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Barrier Certified Safety Learning Control: When Sum-of-Square Programming Meets Reinforcement Learning	Jun 16, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Deep Reinforcement Learning For Sequence to Sequence Models	May 24, 2018	Abstractive Text SummarizationCaption Generation	CodeCode Available	1	5
A General Contextualized Rewriting Framework for Text Summarization	Jul 13, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1	5
Deep Reinforcement Learning for Real-Time Optimization of Pumps in Water Distribution Systems	Oct 13, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Ask Your Humans: Using Human Instructions to Improve Generalization in Reinforcement Learning	Nov 1, 2020	Multi-Task Learningreinforcement-learning	CodeCode Available	1	5
Deep Reinforcement Learning for Resource Allocation in Business Processes	Mar 29, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Batch Exploration with Examples for Scalable Robotic Reinforcement Learning	Oct 22, 2020	Offline RLreinforcement-learning	CodeCode Available	1	5
Deep Reinforcement Learning for Solving the Heterogeneous Capacitated Vehicle Routing Problem	Oct 6, 2021	DecoderDeep Reinforcement Learning	CodeCode Available	1	5
Frame Mining: a Free Lunch for Learning Robotic Manipulation from 3D Point Clouds	Oct 14, 2022	3D Point Cloud Reinforcement LearningImitation Learning	CodeCode Available	1	5
ManiSkill2: A Unified Benchmark for Generalizable Manipulation Skills	Feb 9, 2023	GPUImitation Learning	CodeCode Available	1	5
GAEA: Graph Augmentation for Equitable Access via Reinforcement Learning	Dec 7, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Deep Reinforcement Learning for Turbulence Modeling in Large Eddy Simulations	Jun 21, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Toward Deep Supervised Anomaly Detection: Reinforcement Learning from Partially Labeled Anomaly Data	Sep 15, 2020	Anomaly DetectionDeep Reinforcement Learning	CodeCode Available	1	5
Deep Reinforcement Learning for URLLC data management on top of scheduled eMBB traffic	Mar 2, 2021	Deep Reinforcement LearningManagement	CodeCode Available	1	5
Accelerating Robot Learning of Contact-Rich Manipulations: A Curriculum Learning Study	Apr 27, 2022	Contact-rich ManipulationReinforcement Learning (RL)	CodeCode Available	1	5
A Deep Reinforcement Learning Algorithm Using Dynamic Attention Model for Vehicle Routing Problems	Feb 9, 2020	Combinatorial OptimizationDecoder	CodeCode Available	1	5
Deep Reinforcement Learning from Self-Play in Imperfect-Information Games	Mar 3, 2016	Card GamesDeep Reinforcement Learning	CodeCode Available	1	5
FlapAI Bird: Training an Agent to Play Flappy Bird Using Reinforcement Learning Techniques	Mar 21, 2020	Q-Learningreinforcement-learning	CodeCode Available	1	5
A Deep Reinforced Model for Zero-Shot Cross-Lingual Summarization with Bilingual Semantic Similarity Rewards	Jun 27, 2020	Machine Translationreinforcement-learning	CodeCode Available	1	5
First return, then explore	Apr 27, 2020	Atari GamesMontezuma's Revenge	CodeCode Available	1	5

Show:10 25 50

← PrevPage 60 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified