Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–325 of 382 papers

Title	Date	Tasks	Status
Almost sure convergence rates of stochastic gradient methods under gradient domination	May 22, 2024	Policy Gradient Methodsreinforcement-learning	—Unverified
Analysis and Improvement of Policy Gradient Estimation	Dec 1, 2011	Policy Gradient Methodsreinforcement-learning	—Unverified
Analysis of On-policy Policy Gradient Methods under the Distribution Mismatch	Mar 28, 2025	Policy Gradient Methods	—Unverified
An Improved Analysis of (Variance-Reduced) Policy Gradient and Natural Policy Gradient Methods	Nov 15, 2022	Policy Gradient Methods	—Unverified
An Off-policy Policy Gradient Theorem Using Emphatic Weightings	Nov 22, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified
An operator view of policy gradient methods	Jun 19, 2020	Policy Gradient Methods	—Unverified
On Linear Convergence of Policy Gradient Methods for Finite MDPs	Jul 21, 2020	Policy Gradient Methods	—Unverified
An Initial Introduction to Cooperative Multi-Agent Reinforcement Learning	May 10, 2024	MisconceptionsMulti-agent Reinforcement Learning	—Unverified
A Policy Gradient Framework for Stochastic Optimal Control Problems with Global Convergence Guarantee	Feb 11, 2023	Policy Gradient Methods	—Unverified
Approximation Benefits of Policy Gradient Methods with Aggregated States	Jul 22, 2020	Policy Gradient Methods	—Unverified
A reinterpretation of the policy oscillation phenomenon in approximate policy iteration	Dec 1, 2011	Policy Gradient MethodsReinforcement Learning	—Unverified
A Self-Supervised Reinforcement Learning Approach for Fine-Tuning Large Language Models Using Cross-Attention Signals	Feb 14, 2025	Policy Gradient Methods	—Unverified
Assumption Questioning: Latent Copying and Reward Exploitation in Question Generation	Sep 27, 2018	Inductive BiasMachine Translation	—Unverified
A Study of Policy Gradient on a Class of Exactly Solvable Models	Nov 3, 2020	Policy Gradient Methods	—Unverified
Asynchronous Actor-Critic for Multi-Agent Reinforcement Learning	Sep 20, 2022	Decision MakingMulti-agent Reinforcement Learning	—Unverified
Asynchronous Multi-Agent Actor-Critic with Macro-Actions	Sep 29, 2021	Decision MakingPolicy Gradient Methods	—Unverified
Asynchronous stochastic approximations with asymptotically biased errors and deep multi-agent learning	Feb 22, 2018	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified
Augmented Bayesian Policy Search	Jul 5, 2024	Bayesian OptimizationLEMMA	—Unverified
AUGMENTED POLICY GRADIENT METHODS FOR EFFICIENT REINFORCEMENT LEARNING	Sep 25, 2019	Policy Gradient Methodsreinforcement-learning	—Unverified
A unified view of entropy-regularized Markov decision processes	May 22, 2017	Policy Gradient Methodsreinforcement-learning	—Unverified
Batch Policy Gradient Methods for Improving Neural Conversation Models	Feb 10, 2017	ChatbotPolicy Gradient Methods	—Unverified
Batch Reinforcement Learning with a Nonparametric Off-Policy Policy Gradient	Oct 27, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified
Bayesian Residual Policy Optimization: Scalable Bayesian Reinforcement Learning with Clairvoyant Experts	Feb 7, 2020	Decision MakingPolicy Gradient Methods	—Unverified
Beyond Exact Gradients: Convergence of Stochastic Soft-Max Policy Gradient Methods with Entropy Regularization	Oct 19, 2021	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Beyond Stationarity: Convergence Analysis of Stochastic Softmax Policy Gradient Methods	Oct 4, 2023	Decision MakingPolicy Gradient Methods	—Unverified

Show:10 25 50

← PrevPage 13 of 16Next →

No leaderboard results yet.