SOTAVerified|Agents Browse Leaderboard About

Math

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1026–1050 of 1596 papers

Title	Date	Tasks	Status	Hype
REDS: Resource-Efficient Deep Subnetworks for Dynamic Resource Constraints	Nov 22, 2023	Computational EfficiencyMath	—Unverified	0
MathGloss: Building mathematical glossaries from text	Nov 21, 2023	Math	CodeCode Available	1
Meta Prompting for AI Systems	Nov 20, 2023	Data InteractionGSM8K	CodeCode Available	2
System 2 Attention (is something you might need too)	Nov 20, 2023	Math	CodeCode Available	2
DocMath-Eval: Evaluating Math Reasoning Capabilities of LLMs in Understanding Long and Specialized Documents	Nov 16, 2023	Math	CodeCode Available	1
FinanceMath: Knowledge-Intensive Math Reasoning in Finance Domains	Nov 16, 2023	MathMath Word Problem Solving	CodeCode Available	1
StrategyLLM: Large Language Models as Strategy Generators, Executors, Optimizers, and Evaluators for Problem Solving	Nov 15, 2023	Math	CodeCode Available	1
Towards Reasoning in Large Language Models via Multi-Agent Peer Review Collaboration	Nov 14, 2023	DiversityMath	CodeCode Available	1
First-Step Advantage: Importance of Starting Right in Multi-Step Math Reasoning	Nov 14, 2023	GSM8KMath	—Unverified	0
SAIE Framework: Support Alone Isn't Enough -- Advancing LLM Training with Adversarial Remarks	Nov 14, 2023	GSM8KMath	—Unverified	0
VerityMath: Advancing Mathematical Reasoning by Self-Verification Through Unit Consistency	Nov 13, 2023	MathMathematical Reasoning	CodeCode Available	0
Large Language Models' Understanding of Math: Source Criticism and Extrapolation	Nov 12, 2023	Automated Theorem ProvingMath	—Unverified	0
Let's Reinforce Step by Step	Nov 10, 2023	GSM8KLogical Reasoning	—Unverified	0
Conic10K: A Challenging Math Problem Understanding and Reasoning Dataset	Nov 9, 2023	MathNatural Language Understanding	CodeCode Available	1
Agent Lumos: Unified and Modular Training for Open-Source Language Agents	Nov 9, 2023	MathQuestion Answering	CodeCode Available	2
Bias Runs Deep: Implicit Reasoning Biases in Persona-Assigned LLMs	Nov 8, 2023	FairnessMath	CodeCode Available	1
Towards Interpretable Sequence Continuation: Analyzing Shared Circuits in Large Language Models	Nov 7, 2023	Language ModellingLarge Language Model	CodeCode Available	0
Enhancing LLM Intelligence with ARM-RAG: Auxiliary Rationale Memory for Retrieval Augmented Generation	Nov 7, 2023	MathRAG	—Unverified	0
ATHENA: Mathematical Reasoning with Thought Expansion	Nov 2, 2023	MathMathematical Reasoning	CodeCode Available	0
Implicit Chain of Thought Reasoning via Knowledge Distillation	Nov 2, 2023	Knowledge DistillationMath	CodeCode Available	1
Unleashing the Creative Mind: Language Model As Hierarchical Policy For Improved Exploration on Challenging Problem Solving	Nov 1, 2023	In-Context LearningLanguage Modeling	CodeCode Available	0
Learning From Mistakes Makes LLM Better Reasoner	Oct 31, 2023	GSM8KMath	CodeCode Available	1
Breaking Language Barriers in Multilingual Mathematical Reasoning: Insights and Observations	Oct 31, 2023	GSM8KMath	CodeCode Available	1
Exploring the Reliability of Large Language Models as Customized Evaluators for Diverse NLP Tasks	Oct 30, 2023	FairnessMath	CodeCode Available	0
math-PVS: A Large Language Model Framework to Map Scientific Publications to PVS Theories	Oct 25, 2023	Automated Theorem ProvingLanguage Modeling	—Unverified	0

Show:10 25 50

← PrevPage 42 of 64Next →

No leaderboard results yet.