Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1876–1900 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Robust Deep Reinforcement Learning for Quadcopter Control	Nov 6, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	1	5
An Efficient Asynchronous Method for Integrating Evolutionary and Gradient-based Policy Search	Dec 10, 2020	continuous-controlContinuous Control	CodeCode Available	1	5
Generating Adjacency-Constrained Subgoals in Hierarchical Reinforcement Learning	Jun 20, 2020	continuous-controlContinuous Control	CodeCode Available	1	5
Improved Representation of Asymmetrical Distances with Interval Quasimetric Embeddings	Nov 28, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1	5
Avalanche RL: a Continual Reinforcement Learning Library	Feb 28, 2022	Continual LearningOpenAI Gym	CodeCode Available	1	5
Avalon: A Benchmark for RL Generalization Using Procedurally Generated Worlds	Oct 24, 2022	Deep Reinforcement LearningNavigate	CodeCode Available	1	5
A Minimalist Approach to Offline Reinforcement Learning	Jun 12, 2021	Offline RLreinforcement-learning	CodeCode Available	1	5
Generative Adversarial Imitation Learning	Jun 10, 2016	Imitation Learningreinforcement-learning	CodeCode Available	1	5
Implicit Unlikelihood Training: Improving Neural Text Generation with Reinforcement Learning	Jan 11, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
Improved Exploring Starts by Kernel Density Estimation-Based State-Space Coverage Acceleration in Reinforcement Learning	May 19, 2021	Density EstimationReinforcement Learning (RL)	CodeCode Available	1	5
Robust Reinforcement Learning on State Observations with Learned Optimal Adversary	Jan 21, 2021	Adversarial Attackcontinuous-control	CodeCode Available	1	5
Improving and Benchmarking Offline Reinforcement Learning Algorithms	Jun 1, 2023	AttributeBenchmarking	CodeCode Available	1	5
Implementing Reinforcement Learning Datacenter Congestion Control in NVIDIA NICs	Jul 5, 2022	Fairnessreinforcement-learning	CodeCode Available	1	5
ROLL: Visual Self-Supervised Reinforcement Learning with Object Reasoning	Nov 13, 2020	Multi-Goal Reinforcement LearningObject	CodeCode Available	1	5
Geometric Deep Reinforcement Learning for Dynamic DAG Scheduling	Nov 9, 2020	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1	5
Benchmarking Reinforcement Learning Techniques for Autonomous Navigation	Oct 10, 2022	Autonomous NavigationBenchmarking	CodeCode Available	1	5
RoSGAS: Adaptive Social Bot Detection with Reinforced Self-Supervised GNN Architecture Search	Jun 14, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1	5
Implicit Distributional Reinforcement Learning	Jul 13, 2020	Distributional Reinforcement LearningOpenAI Gym	CodeCode Available	1	5
Implementation Matters in Deep Policy Gradients: A Case Study on PPO and TRPO	May 25, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Giving Up Control: Neurons as Reinforcement Learning Agents	Mar 17, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
GNN-DT: Graph Neural Network Enhanced Decision Transformer for Efficient Optimization in Dynamic Environments	Feb 3, 2025	Efficient ExplorationGraph Neural Network	CodeCode Available	1	5
Geometric Multimodal Contrastive Representation Learning	Feb 7, 2022	Reinforcement Learning (RL)Representation Learning	CodeCode Available	1	5
GMAI-VL-R1: Harnessing Reinforcement Learning for Multimodal Medical Reasoning	Apr 2, 2025	Decision MakingDiagnostic	CodeCode Available	1	5
Topology-Aware Network Pruning using Multi-stage Graph Embedding and Reinforcement Learning	Feb 5, 2021	Graph EmbeddingModel Compression	CodeCode Available	1	5
Implementation Matters in Deep RL: A Case Study on PPO and TRPO	May 1, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 76 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified