SOTAVerified|Agents Browse Leaderboard About

Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 382 papers

Title	Date	Tasks	Status	Hype
Direct Retrieval-augmented Optimization: Synergizing Knowledge Selection and Language Models	May 5, 2025	Policy Gradient MethodsRAG	CodeCode Available	3
Ekar: An Explainable Method for Knowledge Aware Recommendation	Jun 22, 2019	Knowledge-Aware RecommendationKnowledge Graphs	CodeCode Available	2
Proximal Policy Optimization Algorithms	Jul 20, 2017	Continuous ControlDota 2	CodeCode Available	2
Reevaluating Policy Gradient Methods for Imperfect-Information Games	Feb 13, 2025	counterfactualDeep Reinforcement Learning	CodeCode Available	1
Fine-Tuning Discrete Diffusion Models with Policy Gradient Methods	Feb 3, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
Divergence-Augmented Policy Optimization	Jan 25, 2025	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
An Attentive Graph Agent for Topology-Adaptive Cyber Defence	Jan 24, 2025	Graph AttentionGraph Neural Network	CodeCode Available	1
Deep Policy Gradient Methods Without Batch Updates, Target Networks, or Replay Buffers	Nov 22, 2024	AvgDeep Reinforcement Learning	CodeCode Available	1
StepTool: A Step-grained Reinforcement Learning Framework for Tool Learning in LLMs	Oct 10, 2024	Information RetrievalPolicy Gradient Methods	CodeCode Available	1
Self-Improvement for Neural Combinatorial Optimization: Sample without Replacement, but Improvement	Mar 22, 2024	Combinatorial OptimizationImitation Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 39Next →

No leaderboard results yet.