Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 382 papers

Title	Date	Tasks	Status
On Linear Convergence of Policy Gradient Methods for Finite MDPs	Jul 21, 2020	Policy Gradient Methods	—Unverified
Identifying Policy Gradient Subspaces	Jan 12, 2024	continuous-controlContinuous Control	—Unverified
Image Captioning based on Deep Reinforcement Learning	Sep 13, 2018	Deep Reinforcement LearningImage Captioning	—Unverified
Improvements on Hindsight Learning	Sep 16, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified
Adaptive Step-Size for Policy Gradient Methods	Dec 1, 2013	Policy Gradient MethodsReinforcement Learning	—Unverified
Improving DAPO from a Mixed-Policy Perspective	Jul 17, 2025	Policy Gradient Methods	—Unverified
DeepGait: Planning and Control of Quadrupedal Gaits using Deep Reinforcement Learning	Sep 18, 2019	Deep Reinforcement LearningMotion Planning	—Unverified
Improving Reward-Conditioned Policies for Multi-Armed Bandits using Normalized Weight Functions	Jun 16, 2024	Multi-Armed BanditsPolicy Gradient Methods	—Unverified
Improving Sample Efficiency and Multi-Agent Communication in RL-based Train Rescheduling	Apr 28, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified
Incremental Policy Gradients for Online Reinforcement Learning Control	Jan 1, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
Global Convergence of Policy Gradient Methods for Linearized Control Problems	Jan 1, 2018	continuous-controlContinuous Control	—Unverified
Independent Policy Gradient for Large-Scale Markov Potential Games: Sharper Rates, Function Approximation, and Game-Agnostic Convergence	Feb 8, 2022	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified
Independent Policy Gradient Methods for Competitive Reinforcement Learning	Jan 11, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
Information Maximizing Exploration with a Latent Dynamics Model	Apr 4, 2018	continuous-controlContinuous Control	—Unverified
Information-Theoretic Opacity-Enforcement in Markov Decision Processes	Apr 30, 2024	Policy Gradient Methods	—Unverified
Intervention-Assisted Policy Gradient Methods for Online Stochastic Queuing Network Optimization: Technical Report	Apr 5, 2024	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Global Convergence of Policy Gradient Methods for the Linear Quadratic Regulator	Jan 15, 2018	continuous-controlContinuous Control	—Unverified
Global Convergence of Natural Policy Gradient with Hessian-aided Momentum Variance Reduction	Jan 2, 2024	MuJoCoPolicy Gradient Methods	—Unverified
Is the Policy Gradient a Gradient?	Jun 17, 2019	Open-Ended Question AnsweringPolicy Gradient Methods	—Unverified
KIPPO: Koopman-Inspired Proximal Policy Optimization	May 20, 2025	Computational Efficiencycontinuous-control	—Unverified
Landscape of Policy Optimization for Finite Horizon MDPs with General State and Action	Sep 25, 2024	Policy Gradient Methods	—Unverified
Learning Decentralized Partially Observable Mean Field Control for Artificial Collective Behavior	Jul 12, 2023	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Global Convergence Guarantees for Federated Policy Gradient Methods with Adversaries	Mar 15, 2024	Decision MakingPolicy Gradient Methods	—Unverified
Learning from Algorithm Feedback: One-Shot SAT Solver Guidance with GNNs	May 21, 2025	Combinatorial OptimizationPolicy Gradient Methods	—Unverified
Computing and Learning Stationary Mean Field Equilibria with Scalar Interactions: Algorithms and Applications	Feb 2, 2025	counterfactualPolicy Gradient Methods	—Unverified

Show:10 25 50

← PrevPage 7 of 16Next →

No leaderboard results yet.