Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–382 of 382 papers

Title	Date	Tasks	Status
End-to-End Neuro-Symbolic Architecture for Image-to-Image Reasoning Tasks	Jun 6, 2021	Image ReconstructionPolicy Gradient Methods	—Unverified
Enhanced DACER Algorithm with High Diffusion Efficiency	May 29, 2025	DenoisingImitation Learning	—Unverified
Entropic Risk Measure in Policy Search	Jun 21, 2019	Policy Gradient Methods	—Unverified
Entropy annealing for policy mirror descent in continuous time and space	May 30, 2024	Policy Gradient Methods	—Unverified
Entropy Regularization with Discounted Future State Distribution in Policy Gradient Methods	Dec 11, 2019	Policy Gradient Methods	—Unverified
Equivalence Between Policy Gradients and Soft Q-Learning	Apr 21, 2017	Policy Gradient MethodsQ-Learning	—Unverified
Equivalence of stochastic and deterministic policy gradients	May 29, 2025	continuous-controlContinuous Control	—Unverified
Optimal Rates of Convergence for Entropy Regularization in Discounted Markov Decision Processes	Jun 6, 2024	Policy Gradient Methods	—Unverified
Evolutionary Policy Optimization	Apr 17, 2025	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Evolutionary Selective Imitation: Interpretable Agents by Imitation Learning Without a Demonstrator	Sep 17, 2020	Imitation LearningOpenAI Gym	—Unverified
Evolution Strategies as an Alternate Learning method for Hierarchical Reinforcement Learning	Sep 29, 2021	Hierarchical Reinforcement LearningPolicy Gradient Methods	—Unverified
Exchangeable Input Representations for Reinforcement Learning	Mar 19, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Expected Policy Gradients for Reinforcement Learning	Jan 10, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified
Fast Global Convergence of Natural Policy Gradient Methods with Entropy Regularization	Jul 13, 2020	Policy Gradient Methods	—Unverified
Federated Natural Policy Gradient and Actor Critic Methods for Multi-task Reinforcement Learning	Nov 1, 2023	Decision MakingPolicy Gradient Methods	—Unverified
Federated Reinforcement Learning with Constraint Heterogeneity	May 6, 2024	Language ModelingLanguage Modelling	—Unverified
Fill-and-Spill: Deep Reinforcement Learning Policy Gradient Methods for Reservoir Operation Decision and Control	Mar 7, 2024	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Fine-Grained AutoAugmentation for Multi-Label Classification	Jul 12, 2021	ClassificationData Augmentation	—Unverified
Fingerprint Policy Optimisation for Robust Reinforcement Learning	May 27, 2018	Bayesian OptimisationContinuous Control	—Unverified
Focused Hierarchical RNNs for Conditional Sequence Processing	Jun 12, 2018	Open-Domain Question AnsweringPolicy Gradient Methods	—Unverified
f-Policy Gradients: A General Framework for Goal Conditioned RL using f-Divergences	Oct 10, 2023	Efficient ExplorationPolicy Gradient Methods	—Unverified
From Imitation to Refinement -- Residual RL for Precise Assembly	Jul 23, 2024	ChunkingPolicy Gradient Methods	—Unverified
GACEM: Generalized Autoregressive Cross Entropy Method for Multi-Modal Black Box Constraint Satisfaction	Feb 17, 2020	Policy Gradient MethodsReinforcement Learning	—Unverified
Geometry and convergence of natural policy gradient methods	Nov 3, 2022	Policy Gradient Methods	—Unverified
Global Convergence Guarantees for Federated Policy Gradient Methods with Adversaries	Mar 15, 2024	Decision MakingPolicy Gradient Methods	—Unverified
Global Convergence of Natural Policy Gradient with Hessian-aided Momentum Variance Reduction	Jan 2, 2024	MuJoCoPolicy Gradient Methods	—Unverified
Global Convergence of Policy Gradient Methods for the Linear Quadratic Regulator	Jan 15, 2018	continuous-controlContinuous Control	—Unverified
Global Convergence of Policy Gradient Methods for Linearized Control Problems	Jan 1, 2018	continuous-controlContinuous Control	—Unverified
Global Convergence of Policy Gradient Methods to (Almost) Locally Optimal Policies	Jun 19, 2019	Autonomous DrivingPolicy Gradient Methods	—Unverified
Global Convergence of Policy Gradient Methods in Reinforcement Learning, Games and Control	Oct 8, 2023	Decision MakingPolicy Gradient Methods	—Unverified
Global Convergence Using Policy Gradient Methods for Model-free Markovian Jump Linear Quadratic Control	Nov 30, 2021	Policy Gradient Methods	—Unverified
Global Optimality and Finite Sample Analysis of Softmax Off-Policy Actor Critic under State Distribution Mismatch	Nov 4, 2021	Policy Gradient Methods	—Unverified

Show:10 25 50

← PrevPage 8 of 8Next →

No leaderboard results yet.