Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6251–6300 of 15113 papers

Title	Date	Tasks	Status
Limited Query Graph Connectivity Test	Feb 25, 2023	Reinforcement Learning (RL)	—Unverified
Limits of Actor-Critic Algorithms for Decision Tree Policies Learning in IBMDPs	Sep 23, 2023	Reinforcement Learning (RL)	—Unverified
Lineage Evolution Reinforcement Learning	Sep 26, 2020	reinforcement-learningReinforcement Learning	—Unverified
Linear Bellman Completeness Suffices for Efficient Online Reinforcement Learning with Few Actions	Jun 17, 2024	regressionReinforcement Learning (RL)	—Unverified
Linear Complementarity for Regularized Policy Evaluation and Improvement	Dec 1, 2010	feature selectionReinforcement Learning	—Unverified
Linear convergence of a policy gradient method for some finite horizon continuous time control problems	Mar 22, 2022	Policy Gradient Methodsreinforcement-learning	—Unverified
Linear Feature Encoding for Reinforcement Learning	Dec 1, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Linear interpolation gives better gradients than Gaussian smoothing in derivative-free optimization	May 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Linear-Quadratic Mean-Field Reinforcement Learning: Convergence of Policy Gradient Methods	Oct 9, 2019	Policy Gradient Methodsreinforcement-learning	—Unverified
Logarithmic regret for episodic continuous-time linear-quadratic reinforcement learning over a finite-time horizon	Jun 27, 2020	parameter estimationReinforcement Learning (RL)	—Unverified
Linear Reinforcement Learning with Ball Structure Action Space	Nov 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Linear Representation Meta-Reinforcement Learning for Instant Adaptation	Jan 12, 2021	continuous-controlContinuous Control	—Unverified
Linear Stochastic Approximation: Constant Step-Size and Iterate Averaging	Sep 12, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
LISPR: An Options Framework for Policy Reuse with Reinforcement Learning	Dec 29, 2020	Continual Learningreinforcement-learning	—Unverified
Listener-Rewarded Thinking in VLMs for Image Preferences	Jun 28, 2025	MemorizationReinforcement Learning (RL)	—Unverified
LlamaRL: A Distributed Asynchronous Reinforcement Learning Framework for Efficient Large-scale LLM Trainin	May 29, 2025	GPUReinforcement Learning (RL)	—Unverified
LLM Alignment as Retriever Optimization: An Information Retrieval Perspective	Feb 6, 2025	Information RetrievalMisinformation	—Unverified
LLM Augmented Hierarchical Agents	Nov 9, 2023	In-Context LearningReinforcement Learning (RL)	—Unverified
LLM-Augmented Symbolic Reinforcement Learning with Landmark-Based Task Decomposition	Oct 2, 2024	Common Sense ReasoningInductive logic programming	—Unverified
LLM-based Multi-Agent Reinforcement Learning: Current and Future Directions	May 17, 2024	Multi-agent Reinforcement LearningQuestion Answering	—Unverified
LLM-Based Offline Learning for Embodied Agents via Consistency-Guided Reward Ensemble	Nov 26, 2024	Offline RLReinforcement Learning (RL)	—Unverified
LLM-Explorer: A Plug-in Reinforcement Learning Policy Exploration Enhancement Driven by Large Language Models	May 21, 2025	MuJoCoReinforcement Learning (RL)	—Unverified
LLM-hRIC: LLM-empowered Hierarchical RAN Intelligent Control for O-RAN	Apr 25, 2025	ManagementReinforcement Learning (RL)	—Unverified
LLMs for Engineering: Teaching Models to Design High Powered Rockets	Apr 27, 2025	Reinforcement Learning (RL)	—Unverified
LLMs Meet Finance: Fine-Tuning Foundation Models for the Open FinLLM Leaderboard	Apr 17, 2025	Reinforcement Learning (RL)	—Unverified
LLMStinger: Jailbreaking LLMs using RL fine-tuned LLMs	Nov 13, 2024	Prompt EngineeringRed Teaming	—Unverified
LLQL: Logistic Likelihood Q-Learning for Reinforcement Learning	Jul 5, 2023	Offline RLQ-Learning	—Unverified
Reward Guidance for Reinforcement Learning Tasks Based on Large Language Models: The LMGT Framework	Sep 7, 2024	Language ModelingLanguage Modelling	—Unverified
Local Advantage Actor-Critic for Robust Multi-Agent Deep Reinforcement Learning	Oct 16, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Local Advantage Networks for Cooperative Multi-Agent Reinforcement Learning	Dec 23, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Local Communication Protocols for Learning Complex Swarm Behaviors with Deep Reinforcement Learning	Sep 21, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Local Differential Privacy for Regret Minimization in Reinforcement Learning	Oct 15, 2020	reinforcement-learningReinforcement Learning	—Unverified
Local Environment Poisoning Attacks on Federated Reinforcement Learning	Mar 5, 2023	Federated LearningOpenAI Gym	—Unverified
LocalEscaper: A Weakly-supervised Framework with Regional Reconstruction for Scalable Neural TSP Solvers	Feb 18, 2025	Reinforcement Learning (RL)Traveling Salesman Problem	—Unverified
Local Explanations for Reinforcement Learning	Feb 8, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Local Feature Swapping for Generalization in Reinforcement Learning	Apr 13, 2022	Memorizationreinforcement-learning	—Unverified
Local-Guided Global: Paired Similarity Representation for Visual Reinforcement Learning	Jan 1, 2023	Atari Gamesreinforcement-learning	—Unverified
Locality Matters: A Scalable Value Decomposition Approach for Cooperative Multi-Agent Reinforcement Learning	Sep 22, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Localized Observation Abstraction Using Piecewise Linear Spatial Decay for Reinforcement Learning in Combat Simulations	Aug 23, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Localizing by Describing: Attribute-Guided Attention Localization for Fine-Grained Recognition	May 20, 2016	Attributereinforcement-learning	—Unverified
Local Linearity: the Key for No-regret Reinforcement Learning in Continuous MDPs	Oct 31, 2024	Reinforcement Learning (RL)	—Unverified
Local Look-Ahead Guidance via Verifier-in-the-Loop for Automated Theorem Proving	Mar 12, 2025	Automated Theorem ProvingReinforcement Learning (RL)	—Unverified
Locally Constrained Representations in Reinforcement Learning	Sep 20, 2022	continuous-controlContinuous Control	—Unverified
Locally Differentially Private Reinforcement Learning for Linear Mixture Markov Decision Processes	Oct 19, 2021	Privacy Preservingreinforcement-learning	—Unverified
Locally Private Distributed Reinforcement Learning	Jan 31, 2020	reinforcement-learningReinforcement Learning	—Unverified
Local Navigation and Docking of an Autonomous Robot Mower using Reinforcement Learning and Computer Vision	Jan 15, 2021	Navigateobject-detection	—Unverified
Local Nonstationarity for Efficient Bayesian Optimization	Jun 5, 2015	Bayesian OptimizationBIG-bench Machine Learning	—Unverified
Local Pairwise Distance Matching for Backpropagation-Free Reinforcement Learning	Jul 15, 2025	Policy Gradient Methodsreinforcement-learning	—Unverified
Local Policy Optimization for Trajectory-Centric Reinforcement Learning	Jan 22, 2020	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Local Search for Policy Iteration in Continuous Control	Oct 12, 2020	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 126 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified