SOTAVerified|Agents Browse Leaderboard About

Math

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 576–600 of 1596 papers

Title	Date	Tasks	Status	Hype
DINGO: Constrained Inference for Diffusion LLMs	May 29, 2025	Math	—Unverified	0
LLM Performance for Code Generation on Noisy Tasks	May 29, 2025	BenchmarkingCode Generation	CodeCode Available	0
PBEBench: A Multi-Step Programming by Examples Reasoning Benchmark inspired by Historical Linguistics	May 29, 2025	Math	—Unverified	0
Matryoshka Model Learning for Improved Elastic Student Models	May 29, 2025	LAMBADAMath	—Unverified	0
Infi-MMR: Curriculum-based Unlocking Multimodal Reasoning via Phased Reinforcement Learning in Multimodal Small Language Models	May 29, 2025	Logical ReasoningMath	—Unverified	0
Decomposing Elements of Problem Solving: What "Math" Does RL Teach?	May 28, 2025	MathMathematical Problem-Solving	CodeCode Available	0
ASyMOB: Algebraic Symbolic Mathematical Operations Benchmark	May 28, 2025	Math	CodeCode Available	0
Maximizing Confidence Alone Improves Reasoning	May 28, 2025	GSM8KMath	—Unverified	0
Walk Before You Run! Concise LLM Reasoning via Reinforcement Learning	May 27, 2025	Math	—Unverified	0
Error Typing for Smarter Rewards: Improving Process Reward Models with Error-Aware Hierarchical Supervision	May 26, 2025	HallucinationMath	CodeCode Available	0
Which Data Attributes Stimulate Math and Code Reasoning? An Investigation via Influence Functions	May 26, 2025	AttributeMath	—Unverified	0
Enigmata: Scaling Logical Reasoning in Large Language Models with Synthetic Verifiable Puzzles	May 26, 2025	ARCLogical Reasoning	—Unverified	0
Inference-time Alignment in Continuous Space	May 26, 2025	Math	CodeCode Available	0
Done Is Better than Perfect: Unlocking Efficient Reasoning by Structured Multi-Turn Decomposition	May 26, 2025	MathReinforcement Learning (RL)	—Unverified	0
Hard Negative Contrastive Learning for Fine-Grained Geometric Understanding in Large Multimodal Models	May 26, 2025	Contrastive LearningMath	CodeCode Available	0
Prismatic Synthesis: Gradient-based Data Diversification Boosts Generalization in LLM Reasoning	May 26, 2025	DiversityMath	—Unverified	0
Improving Multilingual Math Reasoning for African Languages	May 26, 2025	MathMathematical Reasoning	—Unverified	0
The Role of Diversity in In-Context Learning for Large Language Models	May 26, 2025	DiversityIn-Context Learning	—Unverified	0
Interleaved Reasoning for Large Language Models via Reinforcement Learning	May 26, 2025	Logical ReasoningMath	—Unverified	0
Faster and Better LLMs via Latency-Aware Test-Time Scaling	May 26, 2025	Math	—Unverified	0
AI4Math: A Native Spanish Benchmark for University-Level Mathematical Reasoning in Large Language Models	May 25, 2025	MathMathematical Reasoning	—Unverified	0
MMATH: A Multilingual Benchmark for Mathematical Reasoning	May 25, 2025	MathMathematical Reasoning	CodeCode Available	0
Enumerate-Conjecture-Prove: Formally Solving Answer-Construction Problems in Math Competitions	May 24, 2025	Automated Theorem ProvingMath	CodeCode Available	0
Steering LLM Reasoning Through Bias-Only Adaptation	May 24, 2025	GSM8KMath	—Unverified	0
Does Representation Intervention Really Identify Desired Concepts and Elicit Alignment?	May 24, 2025	Code GenerationMath	—Unverified	0

Show:10 25 50

← PrevPage 24 of 64Next →

No leaderboard results yet.