Math

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–775 of 1596 papers

Title	Date	Tasks	Status
Reasoning with Latent Thoughts: On the Power of Looped Transformers	Feb 24, 2025	Language ModelingLanguage Modelling	—Unverified
DISC: DISC: Dynamic Decomposition Improves LLM Inference Scaling	Feb 23, 2025	Computational EfficiencyMath	—Unverified
SBSC: Step-By-Step Coding for Improving Mathematical Olympiad Performance	Feb 23, 2025	Math	—Unverified
Inference Computation Scaling for Feature Augmentation in Recommendation Systems	Feb 22, 2025	MathRecommendation Systems	—Unverified
Does Reasoning Introduce Bias? A Study of Social Bias Evaluation and Mitigation in LLM Reasoning	Feb 21, 2025	Math	—Unverified
The Relationship Between Reasoning and Performance in Large Language Models -- o3 (mini) Thinks Harder, Not Longer	Feb 21, 2025	MathMathematical Reasoning	CodeCode Available
Earlier Tokens Contribute More: Learning Direct Preference Optimization From Temporal Decay Perspective	Feb 20, 2025	GSM8KMath	CodeCode Available
A Survey on Feedback-based Multi-step Reasoning for Large Language Models on Mathematics	Feb 20, 2025	Math	—Unverified
GATE: Graph-based Adaptive Tool Evolution Across Diverse Tasks	Feb 20, 2025	Code GenerationMath	CodeCode Available
CER: Confidence Enhanced Reasoning in LLMs	Feb 20, 2025	MathMathematical Reasoning	CodeCode Available
TreeCut: A Synthetic Unanswerable Math Word Problem Dataset for LLM Hallucination Evaluation	Feb 19, 2025	Dataset GenerationGSM8K	CodeCode Available
BeamLoRA: Beam-Constraint Low-Rank Adaptation	Feb 19, 2025	Code GenerationMath	—Unverified
DiffSampling: Enhancing Diversity and Accuracy in Neural Text Generation	Feb 19, 2025	DiversityExtreme Summarization	—Unverified
The Self-Improvement Paradox: Can Language Models Bootstrap Reasoning Capabilities without External Scaffolding?	Feb 19, 2025	Math	—Unverified
Multi-Step Alignment as Markov Games: An Optimistic Online Gradient Descent Approach with Convergence Guarantees	Feb 18, 2025	Math	—Unverified
Lean-ing on Quality: How High-Quality Data Beats Diverse Multilingual Data in AutoFormalization	Feb 18, 2025	Math	—Unverified
NaturalReasoning: Reasoning in the Wild with 2.8M Challenging Questions	Feb 18, 2025	Knowledge DistillationMath	—Unverified
Thinking Outside the (Gray) Box: A Context-Based Score for Assessing Value and Originality in Neural Text Generation	Feb 18, 2025	DiversityMath	—Unverified
None of the Others: a General Technique to Distinguish Reasoning from Memorization in Multiple-Choice LLM Evaluation Benchmarks	Feb 18, 2025	MathMemorization	—Unverified
Energy-Conscious LLM Decoding: Impact of Text Generation Strategies on GPU Energy Consumption	Feb 17, 2025	BenchmarkingCode Summarization	—Unverified
Why Vision Language Models Struggle with Visual Arithmetic? Towards Enhanced Chart and Geometry Understanding	Feb 17, 2025	Arithmetic ReasoningChart Understanding	—Unverified
Warmup-Distill: Bridge the Distribution Mismatch between Teacher and Student before Knowledge Distillation	Feb 17, 2025	Knowledge DistillationMath	CodeCode Available
Teaching LLMs According to Their Aptitude: Adaptive Reasoning for Mathematical Problem Solving	Feb 17, 2025	MathMathematical Problem-Solving	—Unverified
Hypothesis-Driven Theory-of-Mind Reasoning for Large Language Models	Feb 17, 2025	Math	—Unverified
A Study on Leveraging Search and Self-Feedback for Agent Reasoning	Feb 17, 2025	Math	—Unverified

Show:10 25 50

← PrevPage 31 of 64Next →

No leaderboard results yet.