SOTAVerified|Agents Browse Leaderboard About

Math

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 131–140 of 1596 papers

Title	Date	Tasks	Status	Hype
Steering LLM Reasoning Through Bias-Only Adaptation	May 24, 2025	GSM8KMath	—Unverified	0
Does Representation Intervention Really Identify Desired Concepts and Elicit Alignment?	May 24, 2025	Code GenerationMath	—Unverified	0
MSA at BEA 2025 Shared Task: Disagreement-Aware Instruction Tuning for Multi-Dimensional Evaluation of LLMs as Math Tutors	May 24, 2025	Language ModelingLanguage Modelling	—Unverified	0
On the Effect of Negative Gradient in Group Relative Deep Reinforcement Optimization	May 24, 2025	MathReinforcement Learning (RL)	—Unverified	0
How Is LLM Reasoning Distracted by Irrelevant Context? An Analysis Using a Controlled Benchmark	May 24, 2025	Math	CodeCode Available	0
Anchored Diffusion Language Model	May 24, 2025	Language ModelingLanguage Modelling	—Unverified	0
More Thinking, Less Seeing? Assessing Amplified Hallucination in Multimodal Reasoning Models	May 23, 2025	DiagnosticHallucination	—Unverified	0
Decoupled Visual Interpretation and Linguistic Reasoning for Math Problem Solving	May 23, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
VideoGameBench: Can Vision-Language Models complete popular video games?	May 23, 2025	Math	—Unverified	0
One RL to See Them All: Visual Triple Unified Reinforcement Learning	May 23, 2025	AllMath	—Unverified	0

Show:10 25 50

← PrevPage 14 of 160Next →

No leaderboard results yet.