Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5376–5400 of 15113 papers

Title	Date	Tasks	Status
Incremental Hierarchical Reinforcement Learning with Multitask LMDPs	Sep 27, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Incrementality Bidding via Reinforcement Learning under Mixed and Delayed Rewards	Jun 2, 2022	reinforcement-learningReinforcement Learning	—Unverified
Incrementally Learning Functions of the Return	Jul 5, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Incremental Policy Gradients for Online Reinforcement Learning Control	Jan 1, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
Incremental Reinforcement Learning --- a New Continuous Reinforcement Learning Frame Based on Stochastic Differential Equation methods	Aug 8, 2019	Autonomous Drivingreinforcement-learning	—Unverified
Incremental Text to Speech for Neural Sequence-to-Sequence Models using Reinforcement Learning	Aug 7, 2020	Audio Generationreinforcement-learning	—Unverified
Independent Learning in Stochastic Games	Nov 23, 2021	Autonomous DrivingReinforcement Learning (RL)	—Unverified
Independent Policy Gradient for Large-Scale Markov Potential Games: Sharper Rates, Function Approximation, and Game-Agnostic Convergence	Feb 8, 2022	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified
Independent Policy Gradient Methods for Competitive Reinforcement Learning	Jan 11, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
Independent RL for Cooperative-Competitive Agents: A Mean-Field Perspective	Mar 17, 2024	Problem DecompositionReinforcement Learning (RL)	—Unverified
Index Selection for NoSQL Database with Deep Reinforcement Learning	Jun 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Individual-Level Inverse Reinforcement Learning for Mean Field Games	Feb 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Individual specialization in multi-task environments with multiagent reinforcement learners	Dec 29, 2019	FairnessMulti-agent Reinforcement Learning	—Unverified
Indoor Point-to-Point Navigation with Deep Reinforcement Learning and Ultra-wideband	Nov 18, 2020	Autonomous NavigationDeep Reinforcement Learning	—Unverified
Inducing Cooperation via Learning to reshape rewards in semi-cooperative multi-agent reinforcement learning	May 1, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Inducing Cooperation via Team Regret Minimization based Multi-Agent Deep Reinforcement Learning	Nov 18, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Inducing Functions through Reinforcement Learning without Task Specification	Nov 23, 2021	Decision Makingimage-classification	—Unverified
Induction and Exploitation of Subgoal Automata for Reinforcement Learning	Sep 8, 2020	Inductive logic programmingreinforcement-learning	—Unverified
Induction of Subgoal Automata for Reinforcement Learning	Nov 29, 2019	Inductive logic programmingreinforcement-learning	—Unverified
Inductive-bias-driven Reinforcement Learning For Efficient Schedules in Heterogeneous Clusters	Sep 4, 2019	Heuristic SearchInductive Bias	—Unverified
Inductive Bias-driven Reinforcement Learning For Efficient Schedules in Heterogeneous Clusters	Jan 1, 2020	Heuristic SearchInductive Bias	—Unverified
Inference Aided Reinforcement Learning for Incentive Mechanism Design in Crowdsourcing	Jun 1, 2018	Bayesian Inferencereinforcement-learning	—Unverified
Inference-Aware Fine-Tuning for Best-of-N Sampling in Large Language Models	Dec 18, 2024	HumanEvalImitation Learning	—Unverified
Inference-Time Scaling for Generalist Reward Modeling	Apr 3, 2025	Reinforcement Learning (RL)	—Unverified
Inferential Induction: A Novel Framework for Bayesian Reinforcement Learning	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 216 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified