Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 382 papers

Title	Date	Tasks	Status
Evolutionary Policy Optimization	Apr 17, 2025	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
DeepGait: Planning and Control of Quadrupedal Gaits using Deep Reinforcement Learning	Sep 18, 2019	Deep Reinforcement LearningMotion Planning	—Unverified
A Self-Supervised Reinforcement Learning Approach for Fine-Tuning Large Language Models Using Cross-Attention Signals	Feb 14, 2025	Policy Gradient Methods	—Unverified
Current applications and potential future directions of reinforcement learning-based Digital Twins in agriculture	Jun 13, 2024	Decision MakingManagement	—Unverified
Curious Explorer: a provable exploration strategy in Policy Learning	Jun 29, 2021	Policy Gradient Methods	—Unverified
A Study of Policy Gradient on a Class of Exactly Solvable Models	Nov 3, 2020	Policy Gradient Methods	—Unverified
Deep Reinforcement Learning based Blind mmWave MIMO Beam Alignment	Jan 25, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Asynchronous Actor-Critic for Multi-Agent Reinforcement Learning	Sep 20, 2022	Decision MakingMulti-agent Reinforcement Learning	—Unverified
Deterministic Policy Gradient Primal-Dual Methods for Continuous-Space Constrained MDPs	Aug 19, 2024	continuous-controlContinuous Control	—Unverified
Difference Rewards Policy Gradients	Dec 21, 2020	counterfactualMulti-agent Reinforcement Learning	—Unverified
A reinterpretation of the policy oscillation phenomenon in approximate policy iteration	Dec 1, 2011	Policy Gradient MethodsReinforcement Learning	—Unverified
Asynchronous stochastic approximations with asymptotically biased errors and deep multi-agent learning	Feb 22, 2018	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified
Adversarial Policy Gradient for Alternating Markov Games	Jan 1, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified
Countering Language Drift via Grounding	Sep 27, 2018	Language ModelingLanguage Modelling	—Unverified
Diverse Exploration via Conjugate Policies for Policy Gradient Methods	Feb 10, 2019	Policy Gradient Methods	—Unverified
AUGMENTED POLICY GRADIENT METHODS FOR EFFICIENT REINFORCEMENT LEARNING	Sep 25, 2019	Policy Gradient Methodsreinforcement-learning	—Unverified
A Large Deviations Perspective on Policy Gradient Algorithms	Nov 13, 2023	Policy Gradient Methodsreinforcement-learning	—Unverified
Efficient Baseline-free Sampling in Parameter Exploring Policy Gradients: Super Symmetric PGPE	Dec 13, 2013	Policy Gradient Methods	—Unverified
Correcting discount-factor mismatch in on-policy policy gradient methods	Jun 23, 2023	OpenAI GymPolicy Gradient Methods	—Unverified
Reinforcement Learning for Causal Discovery without Acyclicity Constraints	Aug 24, 2024	Causal DiscoveryEfficient Exploration	—Unverified
Efficient Wasserstein and Sinkhorn Policy Optimization	Sep 29, 2021	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Approximation Benefits of Policy Gradient Methods with Aggregated States	Jul 22, 2020	Policy Gradient Methods	—Unverified
Elementary Analysis of Policy Gradient Methods	Apr 4, 2024	Policy Gradient Methods	—Unverified
End-to-End Neuro-Symbolic Architecture for Image-to-Image Reasoning Tasks	Jun 6, 2021	Image ReconstructionPolicy Gradient Methods	—Unverified
Convergence of policy gradient methods for finite-horizon exploratory linear-quadratic control problems	Nov 1, 2022	Policy Gradient Methods	—Unverified

Show:10 25 50

← PrevPage 4 of 16Next →

No leaderboard results yet.