Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5351–5400 of 15113 papers

Title	Date	Tasks	Status
Improving width-based planning with compact policies	Jun 15, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Improving Zero-shot Generalization in Offline Reinforcement Learning using Generalized Similarity Functions	Nov 29, 2021	Contrastive LearningDecision Making	—Unverified
IM-RAG: Multi-Round Retrieval-Augmented Generation Through Learning Inner Monologues	May 15, 2024	Information RetrievalQuestion Answering	—Unverified
IMRL: Integrating Visual, Physical, Temporal, and Geometric Representations for Enhanced Food Acquisition	Sep 18, 2024	Imitation LearningReinforcement Learning (RL)	—Unverified
I'm sorry Dave, I'm afraid I can't do that, Deep Q-learning from forbidden action	Oct 4, 2019	Industrial RobotsQ-Learning	—Unverified
Inapplicable Actions Learning for Knowledge Transfer in Reinforcement Learning	Nov 28, 2022	reinforcement-learningReinforcement Learning	—Unverified
Incentive-based demand response for smart grid with reinforcement learning and deep neural network	Dec 18, 2018	reinforcement-learningReinforcement Learning	—Unverified
Incentivizing an Unknown Crowd	Sep 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Generalizing Emergent Communication	Jan 6, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
In-context Exploration-Exploitation for Reinforcement Learning	Mar 11, 2024	Bayesian InferenceBayesian Optimization	—Unverified
Large Language Models can Implement Policy Iteration	Oct 7, 2022	In-Context LearningLanguage Modelling	—Unverified
Incorporating Consistency Verification into Neural Data-to-Document Generation	Aug 15, 2018	reinforcement-learningReinforcement Learning	—Unverified
Incorporating Deception into CyberBattleSim for Autonomous Defense	Aug 31, 2021	CyberBattleSimreinforcement-learning	—Unverified
Incorporating Explicit Uncertainty Estimates into Deep Offline Reinforcement Learning	Jun 2, 2022	reinforcement-learningReinforcement Learning	—Unverified
Incorporating Graph Attention Mechanism into Knowledge Graph Reasoning Based on Deep Reinforcement Learning	Nov 1, 2019	Deep Reinforcement LearningGraph Attention	—Unverified
Incorporating Human Domain Knowledge into Large Scale Cost Function Learning	Dec 13, 2016	Motion Planningreinforcement-learning	—Unverified
Incorporating Pragmatic Reasoning Communication into Emergent Language	Jun 7, 2020	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Incorporating Relational Background Knowledge into Reinforcement Learning via Differentiable Inductive Logic Programming	Mar 23, 2020	Deep Reinforcement LearningInductive logic programming	—Unverified
Incorporating Rivalry in Reinforcement Learning for a Competitive Game	Nov 2, 2020	reinforcement-learningReinforcement Learning	—Unverified
Incorporating Stylistic Lexical Preferences in Generative Language Models	Oct 22, 2020	Language ModelingLanguage Modelling	—Unverified
Incorporating Voice Instructions in Model-Based Reinforcement Learning for Self-Driving Cars	Jun 21, 2022	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified
Incorporation of Deep Neural Network & Reinforcement Learning with Domain Knowledge	Jul 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Increasing Energy Efficiency of Massive-MIMO Network via Base Stations Switching using Reinforcement Learning and Radio Environment Maps	Mar 8, 2021	Reinforcement Learning (RL)	—Unverified
Increasing the Efficiency of Policy Learning for Autonomous Vehicles by Multi-Task Representation Learning	Mar 26, 2021	Autonomous VehiclesDecision Making	—Unverified
Data Informed Residual Reinforcement Learning for High-Dimensional Robotic Tracking Control	Oct 28, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Incremental Hierarchical Reinforcement Learning with Multitask LMDPs	Sep 27, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Incrementality Bidding via Reinforcement Learning under Mixed and Delayed Rewards	Jun 2, 2022	reinforcement-learningReinforcement Learning	—Unverified
Incrementally Learning Functions of the Return	Jul 5, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Incremental Policy Gradients for Online Reinforcement Learning Control	Jan 1, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
Incremental Reinforcement Learning --- a New Continuous Reinforcement Learning Frame Based on Stochastic Differential Equation methods	Aug 8, 2019	Autonomous Drivingreinforcement-learning	—Unverified
Incremental Text to Speech for Neural Sequence-to-Sequence Models using Reinforcement Learning	Aug 7, 2020	Audio Generationreinforcement-learning	—Unverified
Independent Learning in Stochastic Games	Nov 23, 2021	Autonomous DrivingReinforcement Learning (RL)	—Unverified
Independent Policy Gradient for Large-Scale Markov Potential Games: Sharper Rates, Function Approximation, and Game-Agnostic Convergence	Feb 8, 2022	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified
Independent Policy Gradient Methods for Competitive Reinforcement Learning	Jan 11, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
Independent RL for Cooperative-Competitive Agents: A Mean-Field Perspective	Mar 17, 2024	Problem DecompositionReinforcement Learning (RL)	—Unverified
Index Selection for NoSQL Database with Deep Reinforcement Learning	Jun 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Individual-Level Inverse Reinforcement Learning for Mean Field Games	Feb 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Individual specialization in multi-task environments with multiagent reinforcement learners	Dec 29, 2019	FairnessMulti-agent Reinforcement Learning	—Unverified
Indoor Point-to-Point Navigation with Deep Reinforcement Learning and Ultra-wideband	Nov 18, 2020	Autonomous NavigationDeep Reinforcement Learning	—Unverified
Inducing Cooperation via Learning to reshape rewards in semi-cooperative multi-agent reinforcement learning	May 1, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Inducing Cooperation via Team Regret Minimization based Multi-Agent Deep Reinforcement Learning	Nov 18, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Inducing Functions through Reinforcement Learning without Task Specification	Nov 23, 2021	Decision Makingimage-classification	—Unverified
Induction and Exploitation of Subgoal Automata for Reinforcement Learning	Sep 8, 2020	Inductive logic programmingreinforcement-learning	—Unverified
Induction of Subgoal Automata for Reinforcement Learning	Nov 29, 2019	Inductive logic programmingreinforcement-learning	—Unverified
Inductive-bias-driven Reinforcement Learning For Efficient Schedules in Heterogeneous Clusters	Sep 4, 2019	Heuristic SearchInductive Bias	—Unverified
Inductive Bias-driven Reinforcement Learning For Efficient Schedules in Heterogeneous Clusters	Jan 1, 2020	Heuristic SearchInductive Bias	—Unverified
Inference Aided Reinforcement Learning for Incentive Mechanism Design in Crowdsourcing	Jun 1, 2018	Bayesian Inferencereinforcement-learning	—Unverified
Inference-Aware Fine-Tuning for Best-of-N Sampling in Large Language Models	Dec 18, 2024	HumanEvalImitation Learning	—Unverified
Inference-Time Scaling for Generalist Reward Modeling	Apr 3, 2025	Reinforcement Learning (RL)	—Unverified
Inferential Induction: A Novel Framework for Bayesian Reinforcement Learning	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 108 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified