SOTAVerified|Agents Browse Leaderboard About

Math

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 721–730 of 1596 papers

Title	Date	Tasks	Status	Hype
Math-PUMA: Progressive Upward Multimodal Alignment to Enhance Mathematical Reasoning	Aug 16, 2024	MathMathematical Reasoning	CodeCode Available	1
Does Reasoning Emerge? Examining the Probabilities of Causation in Large Language Models	Aug 15, 2024	Math	—Unverified	0
Leveraging Web-Crawled Data for High-Quality Fine-Tuning	Aug 15, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Bridging and Modeling Correlations in Pairwise Data for Direct Preference Optimization	Aug 14, 2024	InformativenessInstruction Following	CodeCode Available	1
MathScape: Evaluating MLLMs in multimodal Math Scenarios through a Hierarchical Benchmark	Aug 14, 2024	MathMathematical Reasoning	CodeCode Available	0
A Perspective on Large Language Models, Intelligent Machines, and Knowledge Acquisition	Aug 13, 2024	Common Sense ReasoningMath	—Unverified	0
Mutual Reasoning Makes Smaller LLMs Stronger Problem-Solvers	Aug 12, 2024	GSM8KMath	CodeCode Available	4
P3: A Policy-Driven, Pace-Adaptive, and Diversity-Promoted Framework for data pruning in LLM Training	Aug 10, 2024	DiversityLogical Reasoning	—Unverified	0
Examining the Behavior of LLM Architectures Within the Framework of Standardized National Exams in Brazil	Aug 9, 2024	MathMultiple-choice	—Unverified	0
Mathfish: Evaluating Language Model Math Reasoning via Grounding in Educational Curricula	Aug 8, 2024	GSM8KLanguage Modeling	CodeCode Available	1

Show:10 25 50

← PrevPage 73 of 160Next →

No leaderboard results yet.