Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 382 papers

Title	Date	Tasks	Status
Accelerating Policy Gradient by Estimating Value Function from Prior Computation in Deep Reinforcement Learning	Feb 2, 2023	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Bayesian Residual Policy Optimization: Scalable Bayesian Reinforcement Learning with Clairvoyant Experts	Feb 7, 2020	Decision MakingPolicy Gradient Methods	—Unverified
Beyond Exact Gradients: Convergence of Stochastic Soft-Max Policy Gradient Methods with Entropy Regularization	Oct 19, 2021	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Beyond Stationarity: Convergence Analysis of Stochastic Softmax Policy Gradient Methods	Oct 4, 2023	Decision MakingPolicy Gradient Methods	—Unverified
Deep Reinforcement Learning based Blind mmWave MIMO Beam Alignment	Jan 25, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
A unified view of entropy-regularized Markov decision processes	May 22, 2017	Policy Gradient Methodsreinforcement-learning	—Unverified
AUGMENTED POLICY GRADIENT METHODS FOR EFFICIENT REINFORCEMENT LEARNING	Sep 25, 2019	Policy Gradient Methodsreinforcement-learning	—Unverified
Factored Policy Gradients: Leveraging Structure for Efficient Learning in MOMDPs	Feb 20, 2021	Policy Gradient Methods	—Unverified
A Large Deviations Perspective on Policy Gradient Algorithms	Nov 13, 2023	Policy Gradient Methodsreinforcement-learning	—Unverified
Momentum-Based Policy Gradient with Second-Order Information	May 17, 2022	Policy Gradient Methods	—Unverified
An Off-policy Policy Gradient Theorem Using Emphatic Weightings	Nov 22, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified
Commodities Trading through Deep Policy Gradient Methods	Aug 10, 2023	Algorithmic TradingDeep Reinforcement Learning	—Unverified
Augmented Bayesian Policy Search	Jul 5, 2024	Bayesian OptimizationLEMMA	—Unverified
Asynchronous stochastic approximations with asymptotically biased errors and deep multi-agent learning	Feb 22, 2018	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified
A K-fold Method for Baseline Estimation in Policy Gradient Algorithms	Jan 3, 2017	MuJoCoPolicy Gradient Methods	—Unverified
Accelerated Reinforcement Learning	Oct 23, 2017	Policy Gradient Methodsreinforcement-learning	—Unverified
Asynchronous Multi-Agent Actor-Critic with Macro-Actions	Sep 29, 2021	Decision MakingPolicy Gradient Methods	—Unverified
Asynchronous Actor-Critic for Multi-Agent Reinforcement Learning	Sep 20, 2022	Decision MakingMulti-agent Reinforcement Learning	—Unverified
A Hybrid Approach Between Adversarial Generative Networks and Actor-Critic Policy Gradient for Low Rate High-Resolution Image Compression	Jun 11, 2019	DecoderImage Compression	—Unverified
A Study of Policy Gradient on a Class of Exactly Solvable Models	Nov 3, 2020	Policy Gradient Methods	—Unverified
Assumption Questioning: Latent Copying and Reward Exploitation in Question Generation	Sep 27, 2018	Inductive BiasMachine Translation	—Unverified
Actor-Critic Reinforcement Learning with Phased Actor	Apr 18, 2024	Policy Gradient Methodsreinforcement-learning	—Unverified
DeepGait: Planning and Control of Quadrupedal Gaits using Deep Reinforcement Learning	Sep 18, 2019	Deep Reinforcement LearningMotion Planning	—Unverified
A Self-Supervised Reinforcement Learning Approach for Fine-Tuning Large Language Models Using Cross-Attention Signals	Feb 14, 2025	Policy Gradient Methods	—Unverified
A reinterpretation of the policy oscillation phenomenon in approximate policy iteration	Dec 1, 2011	Policy Gradient MethodsReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 3 of 16Next →

No leaderboard results yet.