Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10651–10675 of 15113 papers

Title	Date	Tasks	Status
Explicit Explore, Exploit, or Escape (E^4): near-optimal safety-constrained reinforcement learning in polynomial time	Nov 14, 2021	Reinforcement Learning (RL)	—Unverified
Explicit Lipschitz Value Estimation Enhances Policy Robustness Against Perturbation	Apr 22, 2024	continuous-controlContinuous Control	—Unverified
Explicit Mean-Square Error Bounds for Monte-Carlo and Linear Stochastic Approximation	Feb 7, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Explicit Pareto Front Optimization for Constrained Reinforcement Learning	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Explicit Planning for Efficient Exploration in Reinforcement Learning	Dec 1, 2019	Efficient Explorationreinforcement-learning	—Unverified
Explicit Recall for Efficient Exploration	May 1, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Explicit User Manipulation in Reinforcement Learning Based Recommender Systems	Mar 20, 2022	Recommendation Systemsreinforcement-learning	—Unverified
Exploiting Action Impact Regularity and Exogenous State Variables for Offline Reinforcement Learning	Nov 15, 2021	reinforcement-learningReinforcement Learning	—Unverified
Exploiting Contextual Structure to Generate Useful Auxiliary Tasks	Mar 9, 2023	counterfactualCounterfactual Reasoning	—Unverified
Exploiting Deep Reinforcement Learning for Edge Caching in Cell-Free Massive MIMO Systems	Aug 26, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Exploiting Environmental Variation to Improve Policy Robustness in Reinforcement Learning	Sep 27, 2018	reinforcement-learningReinforcement Learning	—Unverified
Exploiting Estimation Bias in Clipped Double Q-Learning for Continous Control Reinforcement Learning Tasks	Feb 14, 2024	Computational Efficiencycontinuous-control	—Unverified
Exploiting generalisation symmetries in accuracy-based learning classifier systems: An initial study	Jan 10, 2014	reinforcement-learningReinforcement Learning	—Unverified
Exploiting Generalization in Offline Reinforcement Learning via Unseen State Augmentations	Aug 7, 2023	Offline RLreinforcement-learning	—Unverified
Exploiting generalization in the subspaces for faster model-based learning	Oct 22, 2017	Decision MakingReinforcement Learning	—Unverified
Exploiting Hierarchy for Learning and Transfer in KL-regularized RL	Mar 18, 2019	continuous-controlContinuous Control	—Unverified
Facilitating Sim-to-real by Intrinsic Stochasticity of Real-Time Simulation in Reinforcement Learning for Robot Manipulation	Apr 12, 2023	Reinforcement Learning (RL)Robot Manipulation	—Unverified
Exploiting Language Instructions for Interpretable and Compositional Reinforcement Learning	Jan 13, 2020	ClassificationDiagnostic	—Unverified
Exploiting Noisy Data in Distant Supervision Relation Classification	Jun 1, 2019	ClassificationGeneral Classification	—Unverified
Exploiting Semantic Epsilon Greedy Exploration Strategy in Multi-Agent Reinforcement Learning	Jan 26, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Exploiting Symbolic Heuristics for the Synthesis of Domain-Specific Temporal Planning Guidance using Reinforcement Learning	May 19, 2025	Reinforcement Learning (RL)	—Unverified
Exploiting the potential of deep reinforcement learning for classification tasks in high-dimensional and unstructured data	Dec 20, 2019	Deep Reinforcement Learningfeature selection	—Unverified
Exploiting Unlabeled Data for Feedback Efficient Human Preference based Reinforcement Learning	Feb 17, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Exploration and Incentives in Reinforcement Learning	Feb 28, 2021	reinforcement-learningReinforcement Learning	—Unverified
Exploration by Distributional Reinforcement Learning	May 4, 2018	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 427 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified