Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 382 papers

Title	Date	Tasks	Status
Curious Explorer: a provable exploration strategy in Policy Learning	Jun 29, 2021	Policy Gradient Methods	—Unverified
Entropy annealing for policy mirror descent in continuous time and space	May 30, 2024	Policy Gradient Methods	—Unverified
Entropy Regularization with Discounted Future State Distribution in Policy Gradient Methods	Dec 11, 2019	Policy Gradient Methods	—Unverified
A reinterpretation of the policy oscillation phenomenon in approximate policy iteration	Dec 1, 2011	Policy Gradient MethodsReinforcement Learning	—Unverified
Equivalence Between Policy Gradients and Soft Q-Learning	Apr 21, 2017	Policy Gradient MethodsQ-Learning	—Unverified
Equivalence of stochastic and deterministic policy gradients	May 29, 2025	continuous-controlContinuous Control	—Unverified
Optimal Rates of Convergence for Entropy Regularization in Discounted Markov Decision Processes	Jun 6, 2024	Policy Gradient Methods	—Unverified
Beyond Exact Gradients: Convergence of Stochastic Soft-Max Policy Gradient Methods with Entropy Regularization	Oct 19, 2021	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Evolutionary Policy Optimization	Apr 17, 2025	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Evolutionary Selective Imitation: Interpretable Agents by Imitation Learning Without a Demonstrator	Sep 17, 2020	Imitation LearningOpenAI Gym	—Unverified
Adversarial Policy Gradient for Alternating Markov Games	Jan 1, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified
Exchangeable Input Representations for Reinforcement Learning	Mar 19, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Expected Policy Gradients for Reinforcement Learning	Jan 10, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified
Countering Language Drift via Grounding	Sep 27, 2018	Language ModelingLanguage Modelling	—Unverified
Correcting discount-factor mismatch in on-policy policy gradient methods	Jun 23, 2023	OpenAI GymPolicy Gradient Methods	—Unverified
Approximation Benefits of Policy Gradient Methods with Aggregated States	Jul 22, 2020	Policy Gradient Methods	—Unverified
Factored Policy Gradients: Leveraging Structure for Efficient Learning in MOMDPs	Feb 20, 2021	Policy Gradient Methods	—Unverified
Fast Global Convergence of Natural Policy Gradient Methods with Entropy Regularization	Jul 13, 2020	Policy Gradient Methods	—Unverified
Federated Natural Policy Gradient and Actor Critic Methods for Multi-task Reinforcement Learning	Nov 1, 2023	Decision MakingPolicy Gradient Methods	—Unverified
Federated Reinforcement Learning with Constraint Heterogeneity	May 6, 2024	Language ModelingLanguage Modelling	—Unverified
Momentum-Based Policy Gradient with Second-Order Information	May 17, 2022	Policy Gradient Methods	—Unverified
Fill-and-Spill: Deep Reinforcement Learning Policy Gradient Methods for Reservoir Operation Decision and Control	Mar 7, 2024	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Fine-Grained AutoAugmentation for Multi-Label Classification	Jul 12, 2021	ClassificationData Augmentation	—Unverified
Convergence of policy gradient methods for finite-horizon exploratory linear-quadratic control problems	Nov 1, 2022	Policy Gradient Methods	—Unverified
A Policy Gradient Framework for Stochastic Optimal Control Problems with Global Convergence Guarantee	Feb 11, 2023	Policy Gradient Methods	—Unverified

Show:10 25 50

← PrevPage 5 of 16Next →

No leaderboard results yet.