Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5526–5550 of 15113 papers

Title	Date	Tasks	Status
Deep Constrained Q-learning	Mar 20, 2020	Autonomous DrivingDecision Making	—Unverified
Interpretable Off-Policy Evaluation in Reinforcement Learning by Highlighting Influential Transitions	Feb 10, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Interpretable Option Discovery using Deep Q-Learning and Variational Autoencoders	Oct 3, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
Interpretable performance analysis towards offline reinforcement learning: A dataset perspective	May 12, 2021	Offline RLQ-Learning	—Unverified
Interpretable pipelines with evolutionarily optimized modules for RL tasks with visual inputs	Feb 10, 2022	Decision MakingEvolutionary Algorithms	—Unverified
Interpretable Policies for Reinforcement Learning by Genetic Programming	Dec 12, 2017	regressionreinforcement-learning	—Unverified
Natural Language Specification of Reinforcement Learning Policies through Differentiable Decision Trees	Jan 18, 2021	BIG-bench Machine Learningreinforcement-learning	—Unverified
Interpretable Preference-based Reinforcement Learning with Tree-Structured Reward Functions	Dec 20, 2021	reinforcement-learningReinforcement Learning	—Unverified
Interpretable Rationale Augmented Charge Prediction System	Aug 1, 2018	ClassificationDeep Reinforcement Learning	—Unverified
Interpretable Recognition of Fused Magnesium Furnace Working Conditions with Deep Convolutional Stochastic Configuration Networks	Jan 6, 2025	Reinforcement Learning (RL)	—Unverified
Interpretable Reinforcement Learning for Load Balancing using Kolmogorov-Arnold Networks	May 20, 2025	Decision MakingKolmogorov-Arnold Networks	—Unverified
Interpretable Reinforcement Learning Inspired by Piaget's Theory of Cognitive Development	Feb 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Interpretable Reinforcement Learning via Neural Additive Models for Inventory Management	Mar 18, 2023	Additive modelsManagement	—Unverified
Interpretable Reinforcement Learning with Ensemble Methods	Sep 19, 2018	BIG-bench Machine LearningInterpretable Machine Learning	—Unverified
Interpretable Reinforcement Learning With Neural Symbolic Logic	Jan 1, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Interpretable Reinforcement Learning with Multilevel Subgoal Discovery	Feb 15, 2022	reinforcement-learningReinforcement Learning	—Unverified
Interpretable Stochastic Model Predictive Control using Distributional Reinforced Estimation for Quadrotor Tracking Systems	May 14, 2022	Distributional Reinforcement LearningModel Predictive Control	—Unverified
Interpretable UAV Collision Avoidance using Deep Reinforcement Learning	May 25, 2021	Collision AvoidanceDeep Reinforcement Learning	—Unverified
Interpreting Graph Drawing with Multi-Agent Reinforcement Learning	Nov 2, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Interpreting Reinforcement Policies through Local Behaviors	Sep 29, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Intersectional Fairness in Reinforcement Learning with Large State and Constraint Spaces	Feb 17, 2025	FairnessReinforcement Learning (RL)	—Unverified
Interval Estimation for Reinforcement-Learning Algorithms in Continuous-State Domains	Dec 1, 2010	Decision Makingparameter estimation	—Unverified
Intervention Aided Reinforcement Learning for Safe and Practical Policy Optimization in Navigation	Nov 15, 2018	Autonomous Navigationreinforcement-learning	—Unverified
Int-HRL: Towards Intention-based Hierarchical Reinforcement Learning	Jun 20, 2023	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Intrinsically Guided Exploration in Meta Reinforcement Learning	Jan 1, 2021	Deep Reinforcement LearningEfficient Exploration	—Unverified

Show:10 25 50

← PrevPage 222 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified