Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 382 papers

Title	Date	Tasks	Status	Score
Hierarchical Policy-Gradient Reinforcement Learning for Multi-Agent Shepherding Control of Non-Cohesive Targets	Apr 3, 2025	Policy Gradient Methodsreinforcement-learning	CodeCode Available	5
Near-Optimal Policy Identification in Robust Constrained Markov Decision Processes via Epigraph Form	Aug 29, 2024	FormPolicy Gradient Methods	CodeCode Available	5
Bayesian Policy Gradients via Alpha Divergence Dropout Inference	Dec 6, 2017	continuous-controlContinuous Control	CodeCode Available	5
Commodities Trading through Deep Policy Gradient Methods	Aug 10, 2023	Algorithmic TradingDeep Reinforcement Learning	—Unverified	0
Fine-Grained AutoAugmentation for Multi-Label Classification	Jul 12, 2021	ClassificationData Augmentation	—Unverified	0
An Off-policy Policy Gradient Theorem Using Emphatic Weightings	Nov 22, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified	0
Fill-and-Spill: Deep Reinforcement Learning Policy Gradient Methods for Reservoir Operation Decision and Control	Mar 7, 2024	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Federated Natural Policy Gradient and Actor Critic Methods for Multi-task Reinforcement Learning	Nov 1, 2023	Decision MakingPolicy Gradient Methods	—Unverified	0
An Improved Analysis of (Variance-Reduced) Policy Gradient and Natural Policy Gradient Methods	Nov 15, 2022	Policy Gradient Methods	—Unverified	0
Momentum-Based Policy Gradient with Second-Order Information	May 17, 2022	Policy Gradient Methods	—Unverified	0
Fast Global Convergence of Natural Policy Gradient Methods with Entropy Regularization	Jul 13, 2020	Policy Gradient Methods	—Unverified	0
Factored Policy Gradients: Leveraging Structure for Efficient Learning in MOMDPs	Feb 20, 2021	Policy Gradient Methods	—Unverified	0
Expected Policy Gradients for Reinforcement Learning	Jan 10, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Exchangeable Input Representations for Reinforcement Learning	Mar 19, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Evolution Strategies as an Alternate Learning method for Hierarchical Reinforcement Learning	Sep 29, 2021	Hierarchical Reinforcement LearningPolicy Gradient Methods	—Unverified	0
CaLcs: Continuously Approximating Longest Common Subsequence for Sequence Level Optimization	Oct 1, 2018	Abstractive Text SummarizationImage Captioning	—Unverified	0
BOTS: Batch Bayesian Optimization of Extended Thompson Sampling for Severely Episode-Limited RL Settings	Nov 30, 2024	Bayesian OptimizationPolicy Gradient Methods	—Unverified	0
Adaptive Batch Size for Safe Policy Gradients	Dec 1, 2017	Policy Gradient MethodsReinforcement Learning	—Unverified	0
Evolutionary Selective Imitation: Interpretable Agents by Imitation Learning Without a Demonstrator	Sep 17, 2020	Imitation LearningOpenAI Gym	—Unverified	0
Federated Reinforcement Learning with Constraint Heterogeneity	May 6, 2024	Language ModelingLanguage Modelling	—Unverified	0
Evolutionary Policy Optimization	Apr 17, 2025	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified	0
Beyond Stationarity: Convergence Analysis of Stochastic Softmax Policy Gradient Methods	Oct 4, 2023	Decision MakingPolicy Gradient Methods	—Unverified	0
Optimal Rates of Convergence for Entropy Regularization in Discounted Markov Decision Processes	Jun 6, 2024	Policy Gradient Methods	—Unverified	0
Beyond Exact Gradients: Convergence of Stochastic Soft-Max Policy Gradient Methods with Entropy Regularization	Oct 19, 2021	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified	0
Analysis of On-policy Policy Gradient Methods under the Distribution Mismatch	Mar 28, 2025	Policy Gradient Methods	—Unverified	0

Show:10 25 50

← PrevPage 5 of 16Next →

No leaderboard results yet.