Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7151–7200 of 15113 papers

Title	Date	Tasks	Status
Explainable Deep Reinforcement Learning: State of the Art and Challenges	Jan 24, 2023	Decision MakingDeep Reinforcement Learning	—Unverified
Explainable Deep Reinforcement Learning Using Introspection in a Non-episodic Task	Aug 18, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Explainable Reinforcement Learning: A Survey	May 13, 2020	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	—Unverified
Explainable Reinforcement Learning for Broad-XAI: A Conceptual Framework and Survey	Aug 20, 2021	Decision MakingExplainable artificial intelligence	—Unverified
Explainable Reinforcement Learning on Financial Stock Trading using SHAP	Aug 18, 2022	Deep Reinforcement LearningEthics	—Unverified
Explainable Reinforcement Learning Through Goal-Based Explanations	Jan 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Explainable Reinforcement Learning via Temporal Policy Decomposition	Jan 7, 2025	reinforcement-learningReinforcement Learning	—Unverified
Explainable robotic systems: Understanding goal-driven actions in a reinforcement learning scenario	Jun 24, 2020	Action UnderstandingDecision Making	—Unverified
Explaining a Deep Reinforcement Learning Docking Agent Using Linear Model Trees with User Adapted Visualization	Mar 1, 2022	Deep Reinforcement LearningExplainable artificial intelligence	—Unverified
Explaining Agent's Decision-making in a Hierarchical Reinforcement Learning Scenario	Dec 14, 2022	Decision MakingHierarchical Reinforcement Learning	—Unverified
Explaining Conditions for Reinforcement Learning Behaviors from Real and Imagined Data	Nov 17, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Explaining Deep Reinforcement Learning Agents In The Atari Domain through a Surrogate Model	Oct 7, 2021	Atari GamesDecision Making	—Unverified
Explaining Online Reinforcement Learning Decisions of Self-Adaptive Systems	Oct 12, 2022	reinforcement-learningReinforcement Learning	—Unverified
Explaining Reinforcement Learning to Mere Mortals: An Empirical Study	Mar 22, 2019	reinforcement-learningReinforcement Learning	—Unverified
Explanation Augmented Feedback in Human-in-the-Loop Reinforcement Learning	Oct 15, 2020	Atari Gamesreinforcement-learning	—Unverified
Explanation of Reinforcement Learning Model in Dynamic Multi-Agent System	Aug 4, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Explicit Explore, Exploit, or Escape (E^4): near-optimal safety-constrained reinforcement learning in polynomial time	Nov 14, 2021	Reinforcement Learning (RL)	—Unverified
Explicit Lipschitz Value Estimation Enhances Policy Robustness Against Perturbation	Apr 22, 2024	continuous-controlContinuous Control	—Unverified
Explicit Mean-Square Error Bounds for Monte-Carlo and Linear Stochastic Approximation	Feb 7, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Explicit Pareto Front Optimization for Constrained Reinforcement Learning	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Explicit Planning for Efficient Exploration in Reinforcement Learning	Dec 1, 2019	Efficient Explorationreinforcement-learning	—Unverified
Explicit Recall for Efficient Exploration	May 1, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Explicit User Manipulation in Reinforcement Learning Based Recommender Systems	Mar 20, 2022	Recommendation Systemsreinforcement-learning	—Unverified
Exploiting Action Impact Regularity and Exogenous State Variables for Offline Reinforcement Learning	Nov 15, 2021	reinforcement-learningReinforcement Learning	—Unverified
Exploiting Contextual Structure to Generate Useful Auxiliary Tasks	Mar 9, 2023	counterfactualCounterfactual Reasoning	—Unverified
Exploiting Deep Reinforcement Learning for Edge Caching in Cell-Free Massive MIMO Systems	Aug 26, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Exploiting Environmental Variation to Improve Policy Robustness in Reinforcement Learning	Sep 27, 2018	reinforcement-learningReinforcement Learning	—Unverified
Exploiting Estimation Bias in Clipped Double Q-Learning for Continous Control Reinforcement Learning Tasks	Feb 14, 2024	Computational Efficiencycontinuous-control	—Unverified
Exploiting generalisation symmetries in accuracy-based learning classifier systems: An initial study	Jan 10, 2014	reinforcement-learningReinforcement Learning	—Unverified
Exploiting Generalization in Offline Reinforcement Learning via Unseen State Augmentations	Aug 7, 2023	Offline RLreinforcement-learning	—Unverified
Exploiting generalization in the subspaces for faster model-based learning	Oct 22, 2017	Decision MakingReinforcement Learning	—Unverified
Exploiting Hierarchy for Learning and Transfer in KL-regularized RL	Mar 18, 2019	continuous-controlContinuous Control	—Unverified
Facilitating Sim-to-real by Intrinsic Stochasticity of Real-Time Simulation in Reinforcement Learning for Robot Manipulation	Apr 12, 2023	Reinforcement Learning (RL)Robot Manipulation	—Unverified
Exploiting Language Instructions for Interpretable and Compositional Reinforcement Learning	Jan 13, 2020	ClassificationDiagnostic	—Unverified
Exploiting Noisy Data in Distant Supervision Relation Classification	Jun 1, 2019	ClassificationGeneral Classification	—Unverified
Exploiting Semantic Epsilon Greedy Exploration Strategy in Multi-Agent Reinforcement Learning	Jan 26, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Exploiting Symbolic Heuristics for the Synthesis of Domain-Specific Temporal Planning Guidance using Reinforcement Learning	May 19, 2025	Reinforcement Learning (RL)	—Unverified
Exploiting the potential of deep reinforcement learning for classification tasks in high-dimensional and unstructured data	Dec 20, 2019	Deep Reinforcement Learningfeature selection	—Unverified
Exploiting Unlabeled Data for Feedback Efficient Human Preference based Reinforcement Learning	Feb 17, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Exploration and Incentives in Reinforcement Learning	Feb 28, 2021	reinforcement-learningReinforcement Learning	—Unverified
Exploration by Distributional Reinforcement Learning	May 4, 2018	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Exploration by Maximizing Rényi Entropy for Reward-Free RL Framework	Jun 11, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Exploration by Random Network Distillation	Jan 17, 2022	Atari GamesDeep Reinforcement Learning	—Unverified
Exploration by Random Reward Perturbation	Jun 10, 2025	DiversityReinforcement Learning (RL)	—Unverified
Exploration by Uncertainty in Reward Space	Sep 27, 2018	Atari GamesEfficient Exploration	—Unverified
Exploration-Driven Representation Learning in Reinforcement Learning	Jun 13, 2021	reinforcement-learningReinforcement Learning	—Unverified
Exploration--Exploitation in MDPs with Options	Mar 25, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Exploration-exploitation trade-off for continuous-time episodic reinforcement learning with linear-convex models	Dec 19, 2021	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
Exploration for Multi-task Reinforcement Learning with Deep Generative Models	Nov 29, 2016	reinforcement-learningReinforcement Learning	—Unverified
Exploration in Deep Reinforcement Learning: From Single-Agent to Multiagent Domain	Sep 14, 2021	Autonomous VehiclesDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 144 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified