SOTAVerified|Agents Browse Leaderboard About

Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 21–30 of 382 papers

Title	Date	Tasks	Status	Hype
A Self-Supervised Reinforcement Learning Approach for Fine-Tuning Large Language Models Using Cross-Attention Signals	Feb 14, 2025	Policy Gradient Methods	—Unverified	0
Reevaluating Policy Gradient Methods for Imperfect-Information Games	Feb 13, 2025	counterfactualDeep Reinforcement Learning	CodeCode Available	1
Fine-Tuning Discrete Diffusion Models with Policy Gradient Methods	Feb 3, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
Computing and Learning Stationary Mean Field Equilibria with Scalar Interactions: Algorithms and Applications	Feb 2, 2025	counterfactualPolicy Gradient Methods	—Unverified	0
Metastable Dynamics of Chain-of-Thought Reasoning: Provable Benefits of Search, RL and Distillation	Feb 2, 2025	Policy Gradient Methods	—Unverified	0
Divergence-Augmented Policy Optimization	Jan 25, 2025	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
An Attentive Graph Agent for Topology-Adaptive Cyber Defence	Jan 24, 2025	Graph AttentionGraph Neural Network	CodeCode Available	1
Multilinear Tensor Low-Rank Approximation for Policy-Gradient Methods in Reinforcement Learning	Jan 8, 2025	Policy Gradient MethodsReinforcement Learning (RL)	CodeCode Available	0
Self-Interested Agents in Collaborative Learning: An Incentivized Adaptive Data-Centric Framework	Dec 9, 2024	Bilevel OptimizationPolicy Gradient Methods	—Unverified	0
Reinforcement Learning: An Overview	Dec 6, 2024	Decision MakingDeep Reinforcement Learning	CodeCode Available	0

Show:10 25 50

← PrevPage 3 of 39Next →

No leaderboard results yet.