Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6276–6300 of 15113 papers

Title	Date	Tasks	Status
LLMStinger: Jailbreaking LLMs using RL fine-tuned LLMs	Nov 13, 2024	Prompt EngineeringRed Teaming	—Unverified
LLQL: Logistic Likelihood Q-Learning for Reinforcement Learning	Jul 5, 2023	Offline RLQ-Learning	—Unverified
Reward Guidance for Reinforcement Learning Tasks Based on Large Language Models: The LMGT Framework	Sep 7, 2024	Language ModelingLanguage Modelling	—Unverified
Local Advantage Actor-Critic for Robust Multi-Agent Deep Reinforcement Learning	Oct 16, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Local Advantage Networks for Cooperative Multi-Agent Reinforcement Learning	Dec 23, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Local Communication Protocols for Learning Complex Swarm Behaviors with Deep Reinforcement Learning	Sep 21, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Local Differential Privacy for Regret Minimization in Reinforcement Learning	Oct 15, 2020	reinforcement-learningReinforcement Learning	—Unverified
Local Environment Poisoning Attacks on Federated Reinforcement Learning	Mar 5, 2023	Federated LearningOpenAI Gym	—Unverified
LocalEscaper: A Weakly-supervised Framework with Regional Reconstruction for Scalable Neural TSP Solvers	Feb 18, 2025	Reinforcement Learning (RL)Traveling Salesman Problem	—Unverified
Local Explanations for Reinforcement Learning	Feb 8, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Local Feature Swapping for Generalization in Reinforcement Learning	Apr 13, 2022	Memorizationreinforcement-learning	—Unverified
Local-Guided Global: Paired Similarity Representation for Visual Reinforcement Learning	Jan 1, 2023	Atari Gamesreinforcement-learning	—Unverified
Locality Matters: A Scalable Value Decomposition Approach for Cooperative Multi-Agent Reinforcement Learning	Sep 22, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Localized Observation Abstraction Using Piecewise Linear Spatial Decay for Reinforcement Learning in Combat Simulations	Aug 23, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Localizing by Describing: Attribute-Guided Attention Localization for Fine-Grained Recognition	May 20, 2016	Attributereinforcement-learning	—Unverified
Local Linearity: the Key for No-regret Reinforcement Learning in Continuous MDPs	Oct 31, 2024	Reinforcement Learning (RL)	—Unverified
Local Look-Ahead Guidance via Verifier-in-the-Loop for Automated Theorem Proving	Mar 12, 2025	Automated Theorem ProvingReinforcement Learning (RL)	—Unverified
Locally Constrained Representations in Reinforcement Learning	Sep 20, 2022	continuous-controlContinuous Control	—Unverified
Locally Differentially Private Reinforcement Learning for Linear Mixture Markov Decision Processes	Oct 19, 2021	Privacy Preservingreinforcement-learning	—Unverified
Locally Private Distributed Reinforcement Learning	Jan 31, 2020	reinforcement-learningReinforcement Learning	—Unverified
Local Navigation and Docking of an Autonomous Robot Mower using Reinforcement Learning and Computer Vision	Jan 15, 2021	Navigateobject-detection	—Unverified
Local Nonstationarity for Efficient Bayesian Optimization	Jun 5, 2015	Bayesian OptimizationBIG-bench Machine Learning	—Unverified
Local Pairwise Distance Matching for Backpropagation-Free Reinforcement Learning	Jul 15, 2025	Policy Gradient Methodsreinforcement-learning	—Unverified
Local Policy Optimization for Trajectory-Centric Reinforcement Learning	Jan 22, 2020	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Local Search for Policy Iteration in Continuous Control	Oct 12, 2020	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 252 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified