Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–725 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Asynchronous Methods for Deep Reinforcement Learning	Feb 4, 2016	Atari GamesCPU	CodeCode Available	1	5
Demonstration-free Autonomous Reinforcement Learning via Implicit and Bidirectional Curriculum	May 17, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Deep Reinforcement Learning For Sequence to Sequence Models	May 24, 2018	Abstractive Text SummarizationCaption Generation	CodeCode Available	1	5
Toward Deep Supervised Anomaly Detection: Reinforcement Learning from Partially Labeled Anomaly Data	Sep 15, 2020	Anomaly DetectionDeep Reinforcement Learning	CodeCode Available	1	5
Automatic Noise Filtering with Dynamic Sparse Training in Deep Reinforcement Learning	Feb 13, 2023	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Affordance Learning from Play for Sample-Efficient Policy Learning	Mar 1, 2022	Deep Reinforcement LearningMotion Planning	CodeCode Available	1	5
Deep Reinforcement Learning with Population-Coded Spiking Neural Network for Continuous Control	Oct 19, 2020	continuous-controlContinuous Control	CodeCode Available	1	5
Automating DBSCAN via Deep Reinforcement Learning	Aug 9, 2022	ClusteringComputational Efficiency	CodeCode Available	1	5
Actor-Attention-Critic for Multi-Agent Reinforcement Learning	Oct 5, 2018	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Autonomous Exploration Under Uncertainty via Deep Reinforcement Learning on Graphs	Jul 24, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1	5
Autonomous Reinforcement Learning: Formalism and Benchmarking	Dec 17, 2021	Benchmarkingreinforcement-learning	CodeCode Available	1	5
Autonomous Racing using a Hybrid Imitation-Reinforcement Learning Architecture	Oct 11, 2021	Autonomous RacingAutonomous Vehicles	CodeCode Available	1	5
De novo PROTAC design using graph-based deep generative models	Nov 4, 2022	Reinforcement Learning (RL)	CodeCode Available	1	5
Developmental Reinforcement Learning of Control Policy of a Quadcopter UAV with Thrust Vectoring Rotors	Jul 15, 2020	Developmental LearningDrone Controller	CodeCode Available	1	5
Accelerating lifelong reinforcement learning via reshaping rewards	Oct 17, 2021	Lifelong learningreinforcement-learning	CodeCode Available	1	5
Adversarial Policies: Attacking Deep Reinforcement Learning	May 25, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Deep Reinforcement Learning for List-wise Recommendations	Dec 30, 2017	Deep Reinforcement LearningRecommendation Systems	CodeCode Available	1	5
Dialogue for Prompting: a Policy-Gradient-Based Discrete Prompt Generation for Few-shot Learning	Aug 14, 2023	Few-Shot LearningReinforcement Learning (RL)	CodeCode Available	1	5
Active MR k-space Sampling with Reinforcement Learning	Jul 20, 2020	Image Reconstructionreinforcement-learning	CodeCode Available	1	5
Deep Reinforcement Learning for Market Making Under a Hawkes Process-Based Limit Order Book Model	Jul 20, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Deep Reinforcement Learning for Process Synthesis	Sep 23, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Deep Reinforcement Learning for Entity Alignment	Mar 7, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1	5
Deep Reinforcement Learning for Cost-Effective Medical Diagnosis	Feb 20, 2023	Anomaly DetectionDeep Reinforcement Learning	CodeCode Available	1	5
Deep Reinforcement Learning for Joint Spectrum and Power Allocation in Cellular Networks	Dec 19, 2020	Deep Reinforcement LearningManagement	CodeCode Available	1	5
Adversarially Trained Actor Critic for Offline Reinforcement Learning	Feb 5, 2022	continuous-controlContinuous Control	CodeCode Available	1	5

Show:10 25 50

← PrevPage 29 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified