SOTAVerified|Agents Browse Leaderboard About Blog

Memorization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11–20 of 1088 papers

Title	Date	Tasks	Status	Hype
MathArena: Evaluating LLMs on Uncontaminated Math Competitions	May 29, 2025	MathMathematical Reasoning	CodeCode Available	3
From Matching to Generation: A Survey on Generative Information Retrieval	Apr 23, 2024	Incremental LearningInformation Retrieval	CodeCode Available	3
AgentTuning: Enabling Generalized Agent Abilities for LLMs	Oct 19, 2023	Memorization	CodeCode Available	3
HeuriGym: An Agentic Benchmark for LLM-Crafted Heuristics in Combinatorial Optimization	Jun 9, 2025	Combinatorial OptimizationMemorization	CodeCode Available	2
LLM-SRBench: A New Benchmark for Scientific Equation Discovery with Large Language Models	Apr 14, 2025	Equation DiscoveryMemorization	CodeCode Available	2
RARE: Retrieval-Augmented Reasoning Modeling	Mar 30, 2025	HallucinationMemorization	CodeCode Available	2
Detecting, Explaining, and Mitigating Memorization in Diffusion Models	Jul 31, 2024	Image GenerationMemorization	CodeCode Available	2
We-Math: Does Your Large Multimodal Model Achieve Human-like Mathematical Reasoning?	Jul 1, 2024	MathMathematical Reasoning	CodeCode Available	2
Be like a Goldfish, Don't Memorize! Mitigating Memorization in Generative LLMs	Jun 14, 2024	Memorization	CodeCode Available	2
HMT: Hierarchical Memory Transformer for Long Context Language Processing	May 9, 2024	Language ModelingLanguage Modelling	CodeCode Available	2

Show:10 25 50

← PrevPage 2 of 109Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PaLM-540B (few-shot, k=5)	Accuracy	95.4	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	80	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	77.7	—	Unverified