Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 382 papers

Title	Date	Tasks	Status	Hype
Policy Gradient Methods in the Presence of Symmetries and State Abstractions	May 9, 2023	continuous-controlContinuous Control	CodeCode Available	1
Distributional Policy Optimization: An Alternative Approach for Continuous Control	May 23, 2019	continuous-controlContinuous Control	CodeCode Available	1
An Efficient Asynchronous Method for Integrating Evolutionary and Gradient-based Policy Search	Dec 10, 2020	continuous-controlContinuous Control	CodeCode Available	1
Learning Multi-Agent Communication through Structured Attentive Reasoning	Dec 1, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Is Reinforcement Learning (Not) for Natural Language Processing: Benchmarks, Baselines, and Building Blocks for Natural Language Policy Optimization	Oct 3, 2022	Decision MakingPolicy Gradient Methods	CodeCode Available	1
Invariant Policy Optimization: Towards Stronger Generalization in Reinforcement Learning	Jun 1, 2020	Policy Gradient Methodsreinforcement-learning	CodeCode Available	1
Competitive Policy Optimization	Jun 18, 2020	Policy Gradient Methods	CodeCode Available	1
StepTool: A Step-grained Reinforcement Learning Framework for Tool Learning in LLMs	Oct 10, 2024	Information RetrievalPolicy Gradient Methods	CodeCode Available	1
Deep Policy Gradient Methods Without Batch Updates, Target Networks, or Replay Buffers	Nov 22, 2024	AvgDeep Reinforcement Learning	CodeCode Available	1
Divergence-Augmented Policy Optimization	Jan 25, 2025	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
An Off-policy Policy Gradient Theorem Using Emphatic Weightings	Nov 22, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified	0
An Improved Analysis of (Variance-Reduced) Policy Gradient and Natural Policy Gradient Methods	Nov 15, 2022	Policy Gradient Methods	—Unverified	0
Momentum-Based Policy Gradient with Second-Order Information	May 17, 2022	Policy Gradient Methods	—Unverified	0
Adaptive Batch Size for Safe Policy Gradients	Dec 1, 2017	Policy Gradient MethodsReinforcement Learning	—Unverified	0
2D or not 2D? Adaptive 3D Convolution Selection for Efficient Video Recognition	Dec 29, 2020	Action RecognitionPolicy Gradient Methods	—Unverified	0
Analysis of On-policy Policy Gradient Methods under the Distribution Mismatch	Mar 28, 2025	Policy Gradient Methods	—Unverified	0
Analysis and Improvement of Policy Gradient Estimation	Dec 1, 2011	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation	Jun 9, 2023	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Almost sure convergence rates of stochastic gradient methods under gradient domination	May 22, 2024	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Batch Policy Gradient Methods for Improving Neural Conversation Models	Feb 10, 2017	ChatbotPolicy Gradient Methods	—Unverified	0
All-Action Policy Gradient Methods: A Numerical Integration Approach	Oct 21, 2019	Allcontinuous-control	—Unverified	0
AdaFrame: Adaptive Frame Selection for Fast Video Recognition	Nov 29, 2018	Policy Gradient MethodsVideo Recognition	—Unverified	0
Accelerating Policy Gradient by Estimating Value Function from Prior Computation in Deep Reinforcement Learning	Feb 2, 2023	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Batch Reinforcement Learning with a Nonparametric Off-Policy Policy Gradient	Oct 27, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified	0
BOTS: Batch Bayesian Optimization of Extended Thompson Sampling for Severely Episode-Limited RL Settings	Nov 30, 2024	Bayesian OptimizationPolicy Gradient Methods	—Unverified	0

Show:10 25 50

← PrevPage 2 of 16Next →

No leaderboard results yet.