Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7551–7575 of 15113 papers

Title	Date	Tasks	Status
GAN-powered Deep Distributional Reinforcement Learning for Resource Management in Network Slicing	May 10, 2019	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
GAN-Based Interactive Reinforcement Learning from Demonstration and Human Evaluative Feedback	Apr 14, 2021	Deep Reinforcement LearningImitation Learning	—Unverified
GAN-based Intrinsic Exploration For Sample Efficient Reinforcement Learning	Jun 28, 2022	Efficient ExplorationGenerative Adversarial Network	—Unverified
Gap-Increasing Policy Evaluation for Efficient and Noise-Tolerant Reinforcement Learning	Jun 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
Gaussian-Mixture-Model Q-Functions for Reinforcement Learning by Riemannian Optimization	Sep 6, 2024	Reinforcement Learning (RL)Riemannian optimization	—Unverified
Gaussian Process Policy Optimization	Mar 2, 2020	MuJoCoreinforcement-learning	—Unverified
GCN-RL Circuit Designer: Transferable Transistor Sizing with Graph Neural Networks and Reinforcement Learning	Apr 30, 2020	Bayesian OptimizationEvolutionary Algorithms	—Unverified
GDI: Rethinking What Makes Reinforcement Learning Different From Supervised Learning	Jun 11, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
GDI: Rethinking What Makes Reinforcement Learning Different from Supervised Learning	Nov 24, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
Gegelati: Lightweight Artificial Intelligence through Generic and Evolvable Tangled Program Graphs	Dec 15, 2020	reinforcement-learningReinforcement Learning	—Unverified
Uncertainty Estimation Using Riemannian Model~Dynamics for Offline Reinforcement Learning	Feb 22, 2021	Autonomous Drivingcontinuous-control	—Unverified
GeneraLight: Improving Environment Generalization of Traffic Signal Control via Meta Reinforcement Learning	Sep 17, 2020	ClusteringGenerative Adversarial Network	—Unverified
General Intelligence Requires Rethinking Exploration	Nov 15, 2022	reinforcement-learningReinforcement Learning	—Unverified
Generalisation in Lifelong Reinforcement Learning through Logical Composition	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Generalised Policy Improvement with Geometric Policy Composition	Jun 17, 2022	continuous-controlContinuous Control	—Unverified
Efficient Reinforcement Learning by Guiding Generalist World Models with Non-Curated Data	Feb 26, 2025	Attributereinforcement-learning	—Unverified
Generalization in Deep RL for TSP Problems via Equivariance and Local Search	Oct 7, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Generalization in Dexterous Manipulation via Geometry-Aware Multi-Task Learning	Nov 4, 2021	Multi-Task LearningObject	—Unverified
Generalization in Generation: A closer look at Exposure Bias	Oct 1, 2019	Language ModelingLanguage Modelling	—Unverified
Generalization in Monitored Markov Decision Processes (Mon-MDPs)	May 13, 2025	Reinforcement Learning (RL)	—Unverified
Generalization in Transfer Learning	Sep 3, 2019	continuous-controlContinuous Control	—Unverified
Generalization of Compositional Tasks with Logical Specification via Implicit Planning	Oct 13, 2024	Graph Neural NetworkReinforcement Learning (RL)	—Unverified
Generalization of Deep Reinforcement Learning for Jammer-Resilient Frequency and Power Allocation	Feb 4, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
Generalization of Reinforcement Learning with Policy-Aware Adversarial Data Augmentation	Jun 29, 2021	Data AugmentationDiversity	—Unverified
Generalization Through the Lens of Learning Dynamics	Dec 11, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 303 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified