Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 226–250 of 382 papers

Title	Date	Tasks	Status
Sample-efficient actor-critic algorithms with an etiquette for zero-sum Markov games	Sep 29, 2021	Policy Gradient Methods	—Unverified
Sample-efficient Deep Reinforcement Learning for Dialog Control	Dec 18, 2016	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Sample Efficient Reinforcement Learning with REINFORCE	Oct 22, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified
Only Relevant Information Matters: Filtering Out Noisy Samples to Boost RL	Apr 8, 2019	continuous-controlContinuous Control	—Unverified
Score-Aware Policy-Gradient Methods and Performance Guarantees using Local Lyapunov Conditions: Applications to Product-Form Stochastic Networks and Queueing Systems	Dec 5, 2023	FormModel-based Reinforcement Learning	—Unverified
Self-Evolving Curriculum for LLM Reasoning	May 20, 2025	Code GenerationPolicy Gradient Methods	—Unverified
Self-Interested Agents in Collaborative Learning: An Incentivized Adaptive Data-Centric Framework	Dec 9, 2024	Bilevel OptimizationPolicy Gradient Methods	—Unverified
Self-Supervised Continuous Control without Policy Gradient	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Semi-On-Policy Training for Sample Efficient Multi-Agent Policy Gradients	Apr 27, 2021	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified
Shattering the Agent-Environment Interface for Fine-Tuning Inclusive Language Models	May 19, 2023	Efficient ExplorationLanguage Modeling	—Unverified
Similarities between policy gradient methods (PGM) in Reinforcement learning (RL) and supervised learning (SL)	Apr 12, 2019	Decision MakingPolicy Gradient Methods	—Unverified
Softmax Policy Gradient Methods Can Take Exponential Time to Converge	Feb 22, 2021	Policy Gradient Methods	—Unverified
SoftTreeMax: Exponential Variance Reduction in Policy Gradient via Tree Search	Jan 30, 2023	GPUPolicy Gradient Methods	—Unverified
SoftTreeMax: Policy Gradient with Tree Search	Sep 28, 2022	Policy Gradient Methods	—Unverified
Solving Robust MDPs through No-Regret Dynamics	May 30, 2023	NavigatePolicy Gradient Methods	—Unverified
Solving Rubik's Cube Without Tricky Sampling	Nov 29, 2024	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Solving Zero-Sum Convex Markov Games	Jun 19, 2025	Policy Gradient Methods	—Unverified
SPPD: Self-training with Process Preference Learning Using Dynamic Value Margin	Feb 19, 2025	GPULogical Reasoning	—Unverified
Stabilizing Dynamical Systems via Policy Gradient Methods	Oct 13, 2021	Policy Gradient Methods	—Unverified
Stabilizing Policy Gradients for Stochastic Differential Equations via Consistency with Perturbation Process	Mar 7, 2024	Drug DesignPolicy Gradient Methods	—Unverified
StartNet: Online Detection of Action Start in Untrimmed Videos	Mar 23, 2019	Action ClassificationPolicy Gradient Methods	—Unverified
Statistically Efficient Off-Policy Policy Gradients	Feb 10, 2020	Policy Gradient MethodsReinforcement Learning	—Unverified
Stein Variational Policy Gradient	Apr 7, 2017	Bayesian Inferencecontinuous-control	—Unverified
Stepsize Learning for Policy Gradient Methods in Contextual Markov Decision Processes	Jun 13, 2023	Meta Reinforcement LearningPolicy Gradient Methods	—Unverified
Stochastic Dimension-reduced Second-order Methods for Policy Optimization	Jan 28, 2023	Policy Gradient MethodsSecond-order methods	—Unverified

Show:10 25 50

← PrevPage 10 of 16Next →

No leaderboard results yet.