Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 382 papers

Title	Date	Tasks	Status
Focused Hierarchical RNNs for Conditional Sequence Processing	Jun 12, 2018	Open-Domain Question AnsweringPolicy Gradient Methods	—Unverified
Analysis of On-policy Policy Gradient Methods under the Distribution Mismatch	Mar 28, 2025	Policy Gradient Methods	—Unverified
Equivalence of stochastic and deterministic policy gradients	May 29, 2025	continuous-controlContinuous Control	—Unverified
Equivalence Between Policy Gradients and Soft Q-Learning	Apr 21, 2017	Policy Gradient MethodsQ-Learning	—Unverified
Bayesian Residual Policy Optimization: Scalable Bayesian Reinforcement Learning with Clairvoyant Experts	Feb 7, 2020	Decision MakingPolicy Gradient Methods	—Unverified
Entropy Regularization with Discounted Future State Distribution in Policy Gradient Methods	Dec 11, 2019	Policy Gradient Methods	—Unverified
Analysis and Improvement of Policy Gradient Estimation	Dec 1, 2011	Policy Gradient Methodsreinforcement-learning	—Unverified
Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation	Jun 9, 2023	Policy Gradient Methodsreinforcement-learning	—Unverified
Entropy annealing for policy mirror descent in continuous time and space	May 30, 2024	Policy Gradient Methods	—Unverified
Entropic Risk Measure in Policy Search	Jun 21, 2019	Policy Gradient Methods	—Unverified
Enhanced DACER Algorithm with High Diffusion Efficiency	May 29, 2025	DenoisingImitation Learning	—Unverified
End-to-End Neuro-Symbolic Architecture for Image-to-Image Reasoning Tasks	Jun 6, 2021	Image ReconstructionPolicy Gradient Methods	—Unverified
Batch Reinforcement Learning with a Nonparametric Off-Policy Policy Gradient	Oct 27, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified
Almost sure convergence rates of stochastic gradient methods under gradient domination	May 22, 2024	Policy Gradient Methodsreinforcement-learning	—Unverified
Elementary Analysis of Policy Gradient Methods	Apr 4, 2024	Policy Gradient Methods	—Unverified
Batch Policy Gradient Methods for Improving Neural Conversation Models	Feb 10, 2017	ChatbotPolicy Gradient Methods	—Unverified
Efficient Wasserstein and Sinkhorn Policy Optimization	Sep 29, 2021	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Reinforcement Learning for Causal Discovery without Acyclicity Constraints	Aug 24, 2024	Causal DiscoveryEfficient Exploration	—Unverified
All-Action Policy Gradient Methods: A Numerical Integration Approach	Oct 21, 2019	Allcontinuous-control	—Unverified
AdaFrame: Adaptive Frame Selection for Fast Video Recognition	Nov 29, 2018	Policy Gradient MethodsVideo Recognition	—Unverified
Accelerating Policy Gradient by Estimating Value Function from Prior Computation in Deep Reinforcement Learning	Feb 2, 2023	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
2D or not 2D? Adaptive 3D Convolution Selection for Efficient Video Recognition	Dec 29, 2020	Action RecognitionPolicy Gradient Methods	—Unverified
Efficient Baseline-free Sampling in Parameter Exploring Policy Gradients: Super Symmetric PGPE	Dec 13, 2013	Policy Gradient Methods	—Unverified
A unified view of entropy-regularized Markov decision processes	May 22, 2017	Policy Gradient Methodsreinforcement-learning	—Unverified
AUGMENTED POLICY GRADIENT METHODS FOR EFFICIENT REINFORCEMENT LEARNING	Sep 25, 2019	Policy Gradient Methodsreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 6 of 16Next →

No leaderboard results yet.