Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 382 papers

Title	Date	Tasks	Status	Hype
On the Global Convergence of Risk-Averse Policy Gradient Methods with Expected Conditional Risk Measures	Jan 26, 2023	Decision MakingPolicy Gradient Methods	—Unverified	0
Partial advantage estimator for proximal policy optimization	Jan 26, 2023	MuJoCoPolicy Gradient Methods	CodeCode Available	1
Improving a sequence-to-sequence nlp model using a reinforcement learning policy algorithm	Dec 28, 2022	ChatbotDeep Reinforcement Learning	—Unverified	0
On the Convergence of Discounted Policy Gradient Methods	Dec 28, 2022	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Policy Gradient in Robust MDPs with Global Convergence Guarantee	Dec 20, 2022	Policy Gradient Methods	CodeCode Available	0
An Improved Analysis of (Variance-Reduced) Policy Gradient and Natural Policy Gradient Methods	Nov 15, 2022	Policy Gradient Methods	—Unverified	0
Geometry and convergence of natural policy gradient methods	Nov 3, 2022	Policy Gradient Methods	—Unverified	0
Convergence of policy gradient methods for finite-horizon exploratory linear-quadratic control problems	Nov 1, 2022	Policy Gradient Methods	—Unverified	0
Symmetric (Optimistic) Natural Policy Gradient for Multi-agent Learning with Parameter Convergence	Oct 23, 2022	Policy Gradient Methods	—Unverified	0
Policy Gradient Methods for Designing Dynamic Output Feedback Controllers	Oct 18, 2022	Policy Gradient Methods	—Unverified	0
On the convergence of policy gradient methods to Nash equilibria in general stochastic games	Oct 17, 2022	Policy Gradient Methods	—Unverified	0
Linear Convergence of Natural Policy Gradient Methods with Log-Linear Policies	Oct 4, 2022	Policy Gradient Methods	—Unverified	0
Is Reinforcement Learning (Not) for Natural Language Processing: Benchmarks, Baselines, and Building Blocks for Natural Language Policy Optimization	Oct 3, 2022	Decision MakingPolicy Gradient Methods	CodeCode Available	1
SoftTreeMax: Policy Gradient with Tree Search	Sep 28, 2022	Policy Gradient Methods	—Unverified	0
Asynchronous Actor-Critic for Multi-Agent Reinforcement Learning	Sep 20, 2022	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
Continuous MDP Homomorphisms and Homomorphic Policy Gradient	Sep 15, 2022	continuous-controlContinuous Control	CodeCode Available	1
On the Optimization Landscape of Dynamic Output Feedback: A Case Study for Linear Quadratic Regulator	Sep 12, 2022	Decision MakingPolicy Gradient Methods	—Unverified	0
The Performance Impact of Combining Agent Factorization with Different Learning Algorithms for Multiagent Coordination	Sep 9, 2022	ManagementPolicy Gradient Methods	CodeCode Available	0
Natural Policy Gradients In Reinforcement Learning Explained	Sep 5, 2022	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Towards Global Optimality in Cooperative MARL with the Transformation And Distillation Framework	Jul 12, 2022	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Reactive Exploration to Cope with Non-Stationarity in Lifelong Reinforcement Learning	Jul 12, 2022	Lifelong learningPolicy Gradient Methods	CodeCode Available	1
Convergence and Price of Anarchy Guarantees of the Softmax Policy Gradient in Markov Potential Games	Jun 15, 2022	Policy Gradient Methods	—Unverified	0
Variance Reduction for Policy-Gradient Methods via Empirical Variance Minimization	Jun 14, 2022	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified	0
How are policy gradient methods affected by the limits of control?	Jun 14, 2022	Policy Gradient Methods	—Unverified	0
Learning Dynamics and Generalization in Reinforcement Learning	Jun 5, 2022	Policy Gradient Methodsreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 6 of 16Next →

No leaderboard results yet.