Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 382 papers

Title	Date	Tasks	Status
Multi Pseudo Q-learning Based Deterministic Policy Gradient for Tracking Control of Autonomous Underwater Vehicles	Sep 7, 2019	Policy Gradient MethodsQ-Learning	—Unverified
Natural Policy Gradient Methods with Parameter-based Exploration for Control Tasks	Dec 1, 2010	Policy Gradient Methods	—Unverified
Natural Policy Gradients In Reinforcement Learning Explained	Sep 5, 2022	Policy Gradient Methodsreinforcement-learning	—Unverified
Neural MMO v1.3: A Massively Multiagent Game Environment for Training and Evaluating Neural Networks	Jan 31, 2020	Policy Gradient MethodsReinforcement Learning	—Unverified
Neural Policy Gradient Methods: Global Optimality and Rates of Convergence	Aug 29, 2019	Policy Gradient Methods	—Unverified
Non-Parametric Stochastic Policy Gradient with Strategic Retreat for Non-Stationary Environment	Mar 24, 2022	Policy Gradient Methods	—Unverified
Object Exchangeability in Reinforcement Learning: Extended Abstract	May 7, 2019	Deep Reinforcement LearningObject	—Unverified
Off-OAB: Off-Policy Policy Gradient Method with Optimal Action-Dependent Baseline	May 4, 2024	Computational EfficiencyMuJoCo	—Unverified
On a Connection between Importance Sampling and the Likelihood Ratio Policy Gradient	Dec 1, 2010	Policy Gradient MethodsReinforcement Learning	—Unverified
On Global Convergence Rates for Federated Policy Gradient under Heterogeneous Environment	May 29, 2025	Federated LearningPolicy Gradient Methods	—Unverified
On the Convergence of Discounted Policy Gradient Methods	Dec 28, 2022	Policy Gradient Methodsreinforcement-learning	—Unverified
On the convergence of policy gradient methods to Nash equilibria in general stochastic games	Oct 17, 2022	Policy Gradient Methods	—Unverified
On the Convergence Rates of Policy Gradient Methods	Jan 19, 2022	Policy Gradient Methods	—Unverified
On the Global Convergence of Risk-Averse Policy Gradient Methods with Expected Conditional Risk Measures	Jan 26, 2023	Decision MakingPolicy Gradient Methods	—Unverified
On the Global Convergence Rates of Softmax Policy Gradient Methods	May 13, 2020	Open-Ended Question AnsweringPolicy Gradient Methods	—Unverified
On the Linear convergence of Natural Policy Gradient Algorithm	May 4, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
On the Optimization Landscape of Dynamic Output Feedback: A Case Study for Linear Quadratic Regulator	Sep 12, 2022	Decision MakingPolicy Gradient Methods	—Unverified
On the Theory of Policy Gradient Methods: Optimality, Approximation, and Distribution Shift	Aug 1, 2019	Policy Gradient MethodsReinforcement Learning	—Unverified
Optimal Resource Allocation in Wireless Control Systems via Deep Policy Gradient	Oct 25, 2019	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Acceleration in Policy Optimization	Jun 18, 2023	Meta-LearningPolicy Gradient Methods	—Unverified
Optimistic Policy Gradient in Multi-Player Markov Games with a Single Controller: Convergence Beyond the Minty Property	Dec 19, 2023	Policy Gradient Methods	—Unverified
Optimistic policy iteration and natural actor-critic: A unifying view and a non-optimality result	Dec 1, 2013	Policy Gradient MethodsReinforcement Learning	—Unverified
Optimization Landscape of Policy Gradient Methods for Discrete-time Static Output Feedback	Oct 29, 2023	Policy Gradient Methods	—Unverified
Optimizing over a Restricted Policy Class in Markov Decision Processes	Feb 26, 2018	Policy Gradient Methods	—Unverified
Optimizing Solution-Samplers for Combinatorial Problems: The Landscape of Policy-Gradient Methods	Oct 8, 2023	Policy Gradient MethodsTraveling Salesman Problem	—Unverified
Ordering-based Conditions for Global Convergence of Policy Gradient Methods	Apr 2, 2025	Policy Gradient Methods	—Unverified
PAGE-PG: A Simple and Loopless Variance-Reduced Policy Gradient Method with Probabilistic Gradient Estimation	Feb 1, 2022	Policy Gradient Methods	—Unverified
PGPS : Coupling Policy Gradient with Population-based Search	Jan 1, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
PG-Rainbow: Using Distributional Reinforcement Learning in Policy Gradient Methods	Jul 18, 2024	Atari GamesDecision Making	—Unverified
Policy Gradient for Coherent Risk Measures	Feb 13, 2015	Policy Gradient MethodsReinforcement Learning	—Unverified
Policy Gradient for Rectangular Robust Markov Decision Processes	Jan 31, 2023	FormPolicy Gradient Methods	—Unverified
Policy gradient learning methods for stochastic control with exit time and applications to share repurchase pricing	Feb 14, 2023	Policy Gradient Methods	—Unverified
Policy Gradient Methods Find the Nash Equilibrium in N-player General-sum Linear-quadratic Games	Jul 27, 2021	Policy Gradient Methods	—Unverified
Policy Gradient Methods for Designing Dynamic Output Feedback Controllers	Oct 18, 2022	Policy Gradient Methods	—Unverified
Policy Gradient Methods for Discrete Time Linear Quadratic Regulator With Random Parameters	Mar 29, 2023	Policy Gradient Methodsreinforcement-learning	—Unverified
Policy Gradient Methods for Off-policy Control	Dec 13, 2015	Policy Gradient Methods	—Unverified
Policy Gradient Methods for Reinforcement Learning with Function Approximation and Action-Dependent Baselines	Jun 20, 2017	Policy Gradient Methodsreinforcement-learning	—Unverified
Policy Gradient Methods for Risk-Sensitive Distributional Reinforcement Learning with Provable Convergence	May 23, 2024	Distributional Reinforcement LearningPolicy Gradient Methods	—Unverified
Policy Gradient Methods for the Noisy Linear Quadratic Regulator over a Finite Horizon	Nov 20, 2020	Policy Gradient Methods	—Unverified
Policy Gradient Optimization of Thompson Sampling Policies	Jun 30, 2020	Policy Gradient MethodsThompson Sampling	—Unverified
Policy Gradients for Contextual Recommendations	Feb 12, 2018	Decision MakingMulti-Armed Bandits	—Unverified
Policy Learning and Evaluation with Randomized Quasi-Monte Carlo	Feb 16, 2022	continuous-controlContinuous Control	—Unverified
Policy Mirror Descent Inherently Explores Action Space	Mar 8, 2023	Efficient ExplorationGeneral Reinforcement Learning	—Unverified
Policy Optimization by Genetic Distillation	Nov 3, 2017	Deep Reinforcement LearningImitation Learning	—Unverified
Policy Optimization for Markovian Jump Linear Quadratic Control: Gradient-Based Methods and Global Convergence	Nov 24, 2020	Policy Gradient Methods	—Unverified
Policy Optimization for H_2 Linear Control with H_ Robustness Guarantee: Implicit Regularization and Global Convergence	Oct 21, 2019	Policy Gradient MethodsReinforcement Learning	—Unverified
Policy Optimization with Demonstrations	Jul 1, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified
Policy Optimization with Stochastic Mirror Descent	Jun 25, 2019	Continuous ControlPolicy Gradient Methods	—Unverified
Policy Search by Target Distribution Learning for Continuous Control	May 27, 2019	continuous-controlContinuous Control	—Unverified
Policy Search for Motor Primitives in Robotics	Dec 1, 2008	Imitation LearningPolicy Gradient Methods	—Unverified

Show:10 25 50

← PrevPage 6 of 8Next →

No leaderboard results yet.