SOTAVerified|Agents Browse Leaderboard About

Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 311–320 of 382 papers

Title	Date	Tasks	Status	Hype
Q-SFT: Q-Learning for Language Models via Supervised Fine-Tuning	Nov 7, 2024	Offline RLPolicy Gradient Methods	—Unverified	0
ReAct Meets ActRe: When Language Agents Enjoy Training Data Autonomy	Mar 21, 2024	Policy Gradient Methods	—Unverified	0
Reinforcement Learning: An Overview	Dec 6, 2024	Decision MakingDeep Reinforcement Learning	—Unverified	0
Reinforcement Learning based Sequential Batch-sampling for Bayesian Optimal Experimental Design	Dec 21, 2021	Deep Reinforcement LearningExperimental Design	—Unverified	0
Reinforcement Learning in Linear Quadratic Deep Structured Teams: Global Convergence of Policy Gradient Methods	Nov 29, 2020	Policy Gradient Methods	—Unverified	0
Residual Policy Gradient: A Reward View of KL-regularized Objective	Mar 14, 2025	Imitation LearningMuJoCo	—Unverified	0
Fast Efficient Hyperparameter Tuning for Policy Gradient Methods	Dec 1, 2019	Policy Gradient Methods	CodeCode Available	0
Learning Zero-Sum Linear Quadratic Games with Improved Sample Complexity and Last-Iterate Convergence	Sep 8, 2023	Multi-agent Reinforcement LearningPolicy Gradient Methods	CodeCode Available	0
Leveraging class abstraction for commonsense reinforcement learning via residual policy gradient methods	Jan 28, 2022	Knowledge GraphsPolicy Gradient Methods	CodeCode Available	0
Synthesis of Stabilizing Recurrent Equilibrium Network Controllers	Mar 31, 2022	Policy Gradient Methods	CodeCode Available	0

Show:10 25 50

← PrevPage 32 of 39Next →

No leaderboard results yet.