Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5401–5450 of 15113 papers

Title	Date	Tasks	Status
InferNet for Delayed Reinforcement Tasks: Addressing the Temporal Credit Assignment Problem	May 2, 2021	Atari GamesOffline RL	—Unverified
Inferring and Conveying Intentionality: Beyond Numerical Rewards to Logical Intentions	Jul 6, 2022	reinforcement-learningReinforcement Learning	—Unverified
Infinite-Horizon Offline Reinforcement Learning with Linear Function Approximation: Curse of Dimensionality and Algorithm	Mar 17, 2021	Off-policy evaluationReinforcement Learning (RL)	—Unverified
Infinite-Horizon Reach-Avoid Zero-Sum Games via Deep Reinforcement Learning	Mar 18, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
Influence-Augmented Local Simulators: A Scalable Solution for Fast Deep RL in Large Networked Systems	Feb 3, 2022	Reinforcement Learning (RL)	—Unverified
Influence-Based Reinforcement Learning for Intrinsically-Motivated Agents	Aug 28, 2021	counterfactualMulti-agent Reinforcement Learning	—Unverified
InfoRL: Interpretable Reinforcement Learning using Information Maximization	May 24, 2019	reinforcement-learningReinforcement Learning	—Unverified
Information-Bottleneck-Based Behavior Representation Learning for Multi-agent Reinforcement learning	Sep 29, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Information Freshness-Aware Task Offloading in Air-Ground Integrated Edge Computing Systems	Jul 15, 2020	Deep Reinforcement LearningEdge-computing	—Unverified
Information Maximizing Exploration with a Latent Dynamics Model	Apr 4, 2018	continuous-controlContinuous Control	—Unverified
INFOrmation Prioritization through EmPOWERment in Visual Model-Based RL	Apr 18, 2022	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
Information Theoretically Aided Reinforcement Learning for Embodied Agents	May 31, 2016	reinforcement-learningReinforcement Learning	—Unverified
Information-Theoretic Confidence Bounds for Reinforcement Learning	Nov 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
Information-Theoretic Considerations in Batch Reinforcement Learning	May 1, 2019	reinforcement-learningReinforcement Learning	—Unverified
Information Theoretic Model Predictive Q-Learning	Dec 31, 2019	Decision Makingmodel	—Unverified
Information-theoretic Task Selection for Meta-Reinforcement Learning	Nov 2, 2020	Meta Reinforcement Learningreinforcement-learning	—Unverified
Informing Autonomous Deception Systems with Cyber Expert Performance Data	Aug 31, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
InfraLib: Enabling Reinforcement Learning and Decision-Making for Large-Scale Infrastructure Management	Sep 5, 2024	BenchmarkingComputational Efficiency	—Unverified
Inherently Explainable Reinforcement Learning in Natural Language	Jan 16, 2022	Graph Attentionreinforcement-learning	—Unverified
Injecting Prior Knowledge for Transfer Learning into Reinforcement Learning Algorithms using Logic Tensor Networks	Jun 15, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Innate-Values-driven Reinforcement Learning based Cooperative Multi-Agent Cognitive Modeling	Jan 10, 2024	reinforcement-learningReinforcement Learning	—Unverified
In Prospect and Retrospect: Reflective Memory Management for Long-term Personalized Dialogue Agents	Mar 11, 2025	ManagementReinforcement Learning (RL)	—Unverified
Iteratively Refined Behavior Regularization for Offline Reinforcement Learning	Jun 9, 2023	D4RLOffline RL	—Unverified
Insights from Verification: Training a Verilog Generation LLM with Reinforcement Learning with Testbench Feedback	Apr 22, 2025	Code GenerationHallucination	—Unverified
Instabilities of Offline RL with Pre-Trained Neural Representation	Mar 8, 2021	Offline RLReinforcement Learning (RL)	—Unverified
Instance-based Generalization in Reinforcement Learning	Dec 1, 2020	Deep Reinforcement LearningGeneralization Bounds	—Unverified
Instance-Dependent Complexity of Contextual Bandits and Reinforcement Learning: A Disagreement-Based Perspective	Oct 7, 2020	Active LearningMulti-Armed Bandits	—Unverified
Instance-Dependent Confidence and Early Stopping for Reinforcement Learning	Jan 21, 2022	reinforcement-learningReinforcement Learning	—Unverified
Instance-Dependent Near-Optimal Policy Identification in Linear MDPs via Online Experiment Design	Jul 6, 2022	Reinforcement Learning (RL)	—Unverified
Instigating Cooperation among LLM Agents Using Adaptive Information Modulation	Sep 16, 2024	Reinforcement Learning (RL)	—Unverified
Instructed Diffuser with Temporal Condition Guidance for Offline Reinforcement Learning	Jun 8, 2023	Decision MakingOffline RL	—Unverified
Instrumental Variable Value Iteration for Causal Offline Reinforcement Learning	Feb 19, 2021	Offline RLreinforcement-learning	—Unverified
Insulin Regimen ML-based control for T2DM patients	Oct 21, 2017	Model-based Reinforcement LearningReinforcement Learning	—Unverified
In Support of Over-Parametrization in Deep Reinforcement Learning: an Empirical Study	May 17, 2019	Deep Reinforcement LearningOpenAI Gym	—Unverified
Insurance pricing on price comparison websites via reinforcement learning	Aug 14, 2023	reinforcement-learningReinforcement Learning	—Unverified
Integral Equations and Machine Learning	Dec 17, 2017	BIG-bench Machine LearningImage Generation	—Unverified
Integrated and Adaptive Guidance and Control for Endoatmospheric Missiles via Reinforcement Learning	Sep 8, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified
Integrated Decision and Control at Multi-Lane Intersections with Mixed Traffic Flow	Aug 30, 2021	Autonomous DrivingModel Predictive Control	—Unverified
Integrated Decision and Control for High-Level Automated Vehicles by Mixed Policy Gradient and Its Experiment Verification	Oct 19, 2022	Autonomous DrivingDecision Making	—Unverified
Integrated Drill Boom Hole-Seeking Control via Reinforcement Learning	Dec 4, 2023	reinforcement-learningReinforcement Learning	—Unverified
Integrated Learning of Dialog Strategies and Semantic Parsing	Apr 1, 2017	BIG-bench Machine LearningManagement	—Unverified
Integrated Longitudinal Speed Decision-Making and Energy Efficiency Control for Connected Electrified Vehicles	Jul 24, 2020	Autonomous VehiclesDecision Making	—Unverified
Integrating Behavior Cloning and Reinforcement Learning for Improved Performance in Dense and Sparse Reward Environments	Oct 9, 2019	Q-Learningreinforcement-learning	—Unverified
Integrating Domain Knowledge for handling Limited Data in Offline RL	Jun 11, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Integrating Episodic Memory into a Reinforcement Learning Agent using Reservoir Sampling	Jun 1, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Integrating Human Knowledge Through Action Masking in Reinforcement Learning for Operations Research	Apr 3, 2025	ManagementReinforcement Learning (RL)	—Unverified
Integrating independent and centralized multi-agent reinforcement learning for traffic signal network optimization	Sep 23, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Integrating Large Language Models and Reinforcement Learning for Non-Linear Reasoning	Oct 17, 2024	Binary ClassificationReinforcement Learning (RL)	—Unverified
Integrating Learning-Based Manipulation and Physics-Based Locomotion for Whole-Body Badminton Robot Control	Apr 24, 2025	Imitation LearningReinforcement Learning (RL)	—Unverified
Integrating LEO Satellite and UAV Relaying via Reinforcement Learning for Non-Terrestrial Networks	May 26, 2020	Deep Reinforcement LearningDimensionality Reduction	—Unverified

Show:10 25 50

← PrevPage 109 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified