Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7151–7175 of 15113 papers

Title	Date	Tasks	Status
Explainable Deep Reinforcement Learning: State of the Art and Challenges	Jan 24, 2023	Decision MakingDeep Reinforcement Learning	—Unverified
Explainable Deep Reinforcement Learning Using Introspection in a Non-episodic Task	Aug 18, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Explainable Reinforcement Learning: A Survey	May 13, 2020	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	—Unverified
Explainable Reinforcement Learning for Broad-XAI: A Conceptual Framework and Survey	Aug 20, 2021	Decision MakingExplainable artificial intelligence	—Unverified
Explainable Reinforcement Learning on Financial Stock Trading using SHAP	Aug 18, 2022	Deep Reinforcement LearningEthics	—Unverified
Explainable Reinforcement Learning Through Goal-Based Explanations	Jan 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Explainable Reinforcement Learning via Temporal Policy Decomposition	Jan 7, 2025	reinforcement-learningReinforcement Learning	—Unverified
Explainable robotic systems: Understanding goal-driven actions in a reinforcement learning scenario	Jun 24, 2020	Action UnderstandingDecision Making	—Unverified
Explaining a Deep Reinforcement Learning Docking Agent Using Linear Model Trees with User Adapted Visualization	Mar 1, 2022	Deep Reinforcement LearningExplainable artificial intelligence	—Unverified
Explaining Agent's Decision-making in a Hierarchical Reinforcement Learning Scenario	Dec 14, 2022	Decision MakingHierarchical Reinforcement Learning	—Unverified
Explaining Conditions for Reinforcement Learning Behaviors from Real and Imagined Data	Nov 17, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Explaining Deep Reinforcement Learning Agents In The Atari Domain through a Surrogate Model	Oct 7, 2021	Atari GamesDecision Making	—Unverified
Explaining Online Reinforcement Learning Decisions of Self-Adaptive Systems	Oct 12, 2022	reinforcement-learningReinforcement Learning	—Unverified
Explaining Reinforcement Learning to Mere Mortals: An Empirical Study	Mar 22, 2019	reinforcement-learningReinforcement Learning	—Unverified
Explanation Augmented Feedback in Human-in-the-Loop Reinforcement Learning	Oct 15, 2020	Atari Gamesreinforcement-learning	—Unverified
Explanation of Reinforcement Learning Model in Dynamic Multi-Agent System	Aug 4, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Explicit Explore, Exploit, or Escape (E^4): near-optimal safety-constrained reinforcement learning in polynomial time	Nov 14, 2021	Reinforcement Learning (RL)	—Unverified
Explicit Lipschitz Value Estimation Enhances Policy Robustness Against Perturbation	Apr 22, 2024	continuous-controlContinuous Control	—Unverified
Explicit Mean-Square Error Bounds for Monte-Carlo and Linear Stochastic Approximation	Feb 7, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Explicit Pareto Front Optimization for Constrained Reinforcement Learning	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Explicit Planning for Efficient Exploration in Reinforcement Learning	Dec 1, 2019	Efficient Explorationreinforcement-learning	—Unverified
Explicit Recall for Efficient Exploration	May 1, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Explicit User Manipulation in Reinforcement Learning Based Recommender Systems	Mar 20, 2022	Recommendation Systemsreinforcement-learning	—Unverified
Exploiting Action Impact Regularity and Exogenous State Variables for Offline Reinforcement Learning	Nov 15, 2021	reinforcement-learningReinforcement Learning	—Unverified
Exploiting Contextual Structure to Generate Useful Auxiliary Tasks	Mar 9, 2023	counterfactualCounterfactual Reasoning	—Unverified

Show:10 25 50

← PrevPage 287 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified