Memorization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 1088 papers

Title	Date	Tasks	Status	Hype	Score
MemoRAG: Moving towards Next-Gen RAG Via Memory-Inspired Knowledge Discovery	Sep 9, 2024	MemorizationQuestion Answering	CodeCode Available	7	5
Pythia: A Suite for Analyzing Large Language Models Across Training and Scaling	Apr 3, 2023	Common Sense ReasoningCoreference Resolution	CodeCode Available	6	5
LIMO: Less is More for Reasoning	Feb 5, 2025	MathMathematical Reasoning	CodeCode Available	5	5
Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models	Jun 9, 2022	Common Sense ReasoningMath	CodeCode Available	4	5
Parameter Efficient Instruction Tuning: An Empirical Study	Nov 25, 2024	Instruction FollowingMemorization	CodeCode Available	4	5
VideoChat-Flash: Hierarchical Compression for Long-Context Video Modeling	Dec 31, 2024	Memorization	CodeCode Available	4	5
Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets	Jan 6, 2022	Memorization	CodeCode Available	4	5
Amortized Planning with Large-Scale Transformers: A Case Study on Chess	Feb 7, 2024	Memorization	CodeCode Available	4	5
MUSE: Machine Unlearning Six-Way Evaluation for Language Models	Jul 8, 2024	ArticlesMachine Unlearning	CodeCode Available	4	5
R1-Searcher++: Incentivizing the Dynamic Knowledge Acquisition of LLMs via Reinforcement Learning	May 22, 2025	MemorizationRAG	CodeCode Available	4	5
MathArena: Evaluating LLMs on Uncontaminated Math Competitions	May 29, 2025	MathMathematical Reasoning	CodeCode Available	3	5
AgentTuning: Enabling Generalized Agent Abilities for LLMs	Oct 19, 2023	Memorization	CodeCode Available	3	5
From Matching to Generation: A Survey on Generative Information Retrieval	Apr 23, 2024	Incremental LearningInformation Retrieval	CodeCode Available	3	5
LawBench: Benchmarking Legal Knowledge of Large Language Models	Sep 28, 2023	ArticlesBenchmarking	CodeCode Available	2	5
PaLM: Scaling Language Modeling with Pathways	Apr 5, 2022	Auto DebuggingCode Generation	CodeCode Available	2	5
HMT: Hierarchical Memory Transformer for Long Context Language Processing	May 9, 2024	Language ModelingLanguage Modelling	CodeCode Available	2	5
Consistent Diffusion Meets Tweedie: Training Exact Ambient Diffusion Models with Noisy Data	Mar 20, 2024	Memorization	CodeCode Available	2	5
Be like a Goldfish, Don't Memorize! Mitigating Memorization in Generative LLMs	Jun 14, 2024	Memorization	CodeCode Available	2	5
We-Math: Does Your Large Multimodal Model Achieve Human-like Mathematical Reasoning?	Jul 1, 2024	MathMathematical Reasoning	CodeCode Available	2	5
RARE: Retrieval-Augmented Reasoning Modeling	Mar 30, 2025	HallucinationMemorization	CodeCode Available	2	5
Scaling Language Models: Methods, Analysis & Insights from Training Gopher	Dec 8, 2021	Abstract AlgebraAnachronisms	CodeCode Available	2	5
Quantifying Memorization Across Neural Language Models	Feb 15, 2022	FairnessMemorization	CodeCode Available	2	5
SciAssess: Benchmarking LLM Proficiency in Scientific Literature Analysis	Mar 4, 2024	BenchmarkingDrug Discovery	CodeCode Available	2	5
Causal Reasoning and Large Language Models: Opening a New Frontier for Causality	Apr 28, 2023	Causal DiscoveryCommon Sense Reasoning	CodeCode Available	2	5
Practical Membership Inference Attacks against Fine-tuned Large Language Models via Self-prompt Calibration	Nov 10, 2023	Inference AttackMembership Inference Attack	CodeCode Available	2	5
A Decade's Battle on Dataset Bias: Are We There Yet?	Mar 13, 2024	Memorization	CodeCode Available	2	5
SimplyRetrieve: A Private and Lightweight Retrieval-Centric Generative AI Tool	Aug 8, 2023	Language ModelingLanguage Modelling	CodeCode Available	2	5
Learning explanations that are hard to vary	Sep 1, 2020	Memorization	CodeCode Available	2	5
HeuriGym: An Agentic Benchmark for LLM-Crafted Heuristics in Combinatorial Optimization	Jun 9, 2025	Combinatorial OptimizationMemorization	CodeCode Available	2	5
Exposing flaws of generative model evaluation metrics and their unfair treatment of diffusion models	Jun 7, 2023	DiversityImage Generation	CodeCode Available	2	5
Detecting, Explaining, and Mitigating Memorization in Diffusion Models	Jul 31, 2024	Image GenerationMemorization	CodeCode Available	2	5
Decoupling Knowledge from Memorization: Retrieval-augmented Prompt Learning	May 29, 2022	Few-Shot Text ClassificationMemorization	CodeCode Available	2	5
Drive Like a Human: Rethinking Autonomous Driving with Large Language Models	Jul 14, 2023	Autonomous DrivingCommon Sense Reasoning	CodeCode Available	2	5
DS-1000: A Natural and Reliable Benchmark for Data Science Code Generation	Nov 18, 2022	Code GenerationMemorization	CodeCode Available	2	5
LLM-SRBench: A New Benchmark for Scientific Equation Discovery with Large Language Models	Apr 14, 2025	Equation DiscoveryMemorization	CodeCode Available	2	5
Data Contamination Quiz: A Tool to Detect and Estimate Contamination in Large Language Models	Nov 10, 2023	GSM8KMemorization	CodeCode Available	1	5
Data Unlearning in Diffusion Models	Mar 2, 2025	Machine UnlearningMemorization	CodeCode Available	1	5
Beyond Gradient Averaging in Parallel Optimization: Improved Robustness through Gradient Agreement Filtering	Dec 24, 2024	image-classificationImage Classification	CodeCode Available	1	5
Advancing Cross-domain Discriminability in Continual Learning of Vision-Language Models	Jun 27, 2024	Continual LearningIncremental Learning	CodeCode Available	1	5
Data Contamination Can Cross Language Barriers	Jun 19, 2024	Memorization	CodeCode Available	1	5
DAT: Training Deep Networks Robust To Label-Noise by Matching the Feature Distributions	Jun 19, 2021	Learning with noisy labelsMemorization	CodeCode Available	1	5
Cousins Of The Vendi Score: A Family Of Similarity-Based Diversity Metrics For Science And Machine Learning	Oct 19, 2023	DiversityMemorization	CodeCode Available	1	5
C-SFDA: A Curriculum Learning Aided Self-Training Framework for Efficient Source Free Domain Adaptation	Mar 30, 2023	Domain AdaptationMemorization	CodeCode Available	1	5
Benchmarking Chinese Commonsense Reasoning of LLMs: From Chinese-Specifics to Reasoning-Memorization Correlations	Mar 21, 2024	BenchmarkingMemorization	CodeCode Available	1	5
AutomaTikZ: Text-Guided Synthesis of Scientific Vector Graphics with TikZ	Sep 30, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Zero-Shot Compositional Policy Learning via Language Grounding	Apr 15, 2020	DescriptiveDomain Adaptation	CodeCode Available	1	5
Co-teaching: Robust Training of Deep Neural Networks with Extremely Noisy Labels	Apr 18, 2018	Image ClassificationLearning with noisy labels	CodeCode Available	1	5
DASH: Warm-Starting Neural Network Training in Stationary Settings without Loss of Plasticity	Oct 30, 2024	Memorization	CodeCode Available	1	5
Adaptive Early-Learning Correction for Segmentation from Noisy Annotations	Oct 7, 2021	ClassificationMedical Image Segmentation	CodeCode Available	1	5
Deciphering the Factors Influencing the Efficacy of Chain-of-Thought: Probability, Memorization, and Noisy Reasoning	Jul 1, 2024	Memorization	CodeCode Available	1	5

Show:10 25 50

← PrevPage 1 of 22Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PaLM-540B (few-shot, k=5)	Accuracy	95.4	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	80	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	77.7	—	Unverified