Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7176–7200 of 15113 papers

Title	Date	Tasks	Status
Exploiting Deep Reinforcement Learning for Edge Caching in Cell-Free Massive MIMO Systems	Aug 26, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Exploiting Environmental Variation to Improve Policy Robustness in Reinforcement Learning	Sep 27, 2018	reinforcement-learningReinforcement Learning	—Unverified
Exploiting Estimation Bias in Clipped Double Q-Learning for Continous Control Reinforcement Learning Tasks	Feb 14, 2024	Computational Efficiencycontinuous-control	—Unverified
Exploiting generalisation symmetries in accuracy-based learning classifier systems: An initial study	Jan 10, 2014	reinforcement-learningReinforcement Learning	—Unverified
Exploiting Generalization in Offline Reinforcement Learning via Unseen State Augmentations	Aug 7, 2023	Offline RLreinforcement-learning	—Unverified
Exploiting generalization in the subspaces for faster model-based learning	Oct 22, 2017	Decision MakingReinforcement Learning	—Unverified
Exploiting Hierarchy for Learning and Transfer in KL-regularized RL	Mar 18, 2019	continuous-controlContinuous Control	—Unverified
Facilitating Sim-to-real by Intrinsic Stochasticity of Real-Time Simulation in Reinforcement Learning for Robot Manipulation	Apr 12, 2023	Reinforcement Learning (RL)Robot Manipulation	—Unverified
Exploiting Language Instructions for Interpretable and Compositional Reinforcement Learning	Jan 13, 2020	ClassificationDiagnostic	—Unverified
Exploiting Noisy Data in Distant Supervision Relation Classification	Jun 1, 2019	ClassificationGeneral Classification	—Unverified
Exploiting Semantic Epsilon Greedy Exploration Strategy in Multi-Agent Reinforcement Learning	Jan 26, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Exploiting Symbolic Heuristics for the Synthesis of Domain-Specific Temporal Planning Guidance using Reinforcement Learning	May 19, 2025	Reinforcement Learning (RL)	—Unverified
Exploiting the potential of deep reinforcement learning for classification tasks in high-dimensional and unstructured data	Dec 20, 2019	Deep Reinforcement Learningfeature selection	—Unverified
Exploiting Unlabeled Data for Feedback Efficient Human Preference based Reinforcement Learning	Feb 17, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Exploration and Incentives in Reinforcement Learning	Feb 28, 2021	reinforcement-learningReinforcement Learning	—Unverified
Exploration by Distributional Reinforcement Learning	May 4, 2018	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Exploration by Maximizing Rényi Entropy for Reward-Free RL Framework	Jun 11, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Exploration by Random Network Distillation	Jan 17, 2022	Atari GamesDeep Reinforcement Learning	—Unverified
Exploration by Random Reward Perturbation	Jun 10, 2025	DiversityReinforcement Learning (RL)	—Unverified
Exploration by Uncertainty in Reward Space	Sep 27, 2018	Atari GamesEfficient Exploration	—Unverified
Exploration-Driven Representation Learning in Reinforcement Learning	Jun 13, 2021	reinforcement-learningReinforcement Learning	—Unverified
Exploration--Exploitation in MDPs with Options	Mar 25, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Exploration-exploitation trade-off for continuous-time episodic reinforcement learning with linear-convex models	Dec 19, 2021	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
Exploration for Multi-task Reinforcement Learning with Deep Generative Models	Nov 29, 2016	reinforcement-learningReinforcement Learning	—Unverified
Exploration in Deep Reinforcement Learning: From Single-Agent to Multiagent Domain	Sep 14, 2021	Autonomous VehiclesDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 288 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified