Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3651–3675 of 15113 papers

Title	Date	Tasks	Status	Score
General Policy Evaluation and Improvement by Learning to Identify Few But Crucial States	Jul 4, 2022	continuous-controlContinuous Control	CodeCode Available	5
Ranking Policy Gradient	Jun 24, 2019	Policy Gradient MethodsReinforcement Learning	CodeCode Available	5
Approximate Model-Based Shielding for Safe Reinforcement Learning	Jul 27, 2023	Atari Gamesmodel	CodeCode Available	5
General policy mapping: online continual reinforcement learning inspired on the insect brain	Nov 30, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
Approximately Optimal Search on a Higher-dimensional Sliding Puzzle	Dec 2, 2024	Reinforcement Learning (RL)	CodeCode Available	5
Generalized Population-Based Training for Hyperparameter Optimization in Reinforcement Learning	Apr 12, 2024	Computational EfficiencyHyperparameter Optimization	CodeCode Available	5
CODEX: A Cluster-Based Method for Explainable Reinforcement Learning	Dec 7, 2023	Clusteringcounterfactual	CodeCode Available	5
Generalized Phase Pressure Control Enhanced Reinforcement Learning for Traffic Signal Control	Mar 26, 2025	Reinforcement Learning (RL)Traffic Signal Control	CodeCode Available	5
Generalized Speedy Q-learning	Nov 1, 2019	Q-LearningReinforcement Learning	CodeCode Available	5
Generative Planning for Temporally Coordinated Exploration in Reinforcement Learning	Jan 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
A Lyapunov-based Approach to Safe Reinforcement Learning	May 20, 2018	Decision Makingreinforcement-learning	CodeCode Available	5
Real-time Adversarial Perturbations against Deep Reinforcement Learning Policies: Attacks and Defenses	Jun 16, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Active Advantage-Aligned Online Reinforcement Learning with Offline Data	Feb 11, 2025	Offline RLreinforcement-learning	CodeCode Available	5
Generalization Tower Network: A Novel Deep Neural Network Architecture for Multi-Task Learning	Oct 27, 2017	Atari GamesMulti-Task Learning	CodeCode Available	5
Generalization in Text-based Games via Hierarchical Reinforcement Learning	Sep 21, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	5
COBRA: Data-Efficient Model-Based RL through Unsupervised Object Discovery and Curiosity-Driven Exploration	May 22, 2019	continuous-controlContinuous Control	CodeCode Available	5
Generalization in Visual Reinforcement Learning with the Reward Sequence Distribution	Feb 19, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
Deep Reinforcement Learning for Multi-Domain Dialogue Systems	Nov 26, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Generalization in Reinforcement Learning with Selective Noise Injection and Information Bottleneck	Oct 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Generalization through Simulation: Integrating Simulated and Real Data into Deep Reinforcement Learning for Vision-Based Autonomous Flight	Feb 11, 2019	Collision AvoidanceDeep Reinforcement Learning	CodeCode Available	5
Generalized Adaptive Transfer Network: Enhancing Transfer Learning in Reinforcement Learning Across Domains	Jul 2, 2025	Atari GamesChatbot	CodeCode Available	5
CoaCor: Code Annotation for Code Retrieval with Reinforcement Learning	Mar 13, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Autonomous Management of Energy-Harvesting IoT Nodes Using Deep Reinforcement Learning	May 10, 2019	Deep Reinforcement LearningManagement	CodeCode Available	5
ReCCoVER: Detecting Causal Confusion for Explainable Reinforcement Learning	Mar 21, 2022	Deep Reinforcement Learningfeature selection	CodeCode Available	5
Attention-Based Reward Shaping for Sparse and Delayed Rewards	May 16, 2025	Reinforcement Learning (RL)	CodeCode Available	5

Show:10 25 50

← PrevPage 147 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified