Memorization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 1088 papers

Title	Date	Tasks	Status	Hype
What Should LLMs Forget? Quantifying Personal Data in LLMs for Right-to-Be-Forgotten Requests	Jul 15, 2025	Machine UnlearningMemorization	—Unverified	0
Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination	Jul 14, 2025	MathMathematical Reasoning	CodeCode Available	1
Entropy-Memorization Law: Evaluating Memorization Difficulty of Data in LLMs	Jul 8, 2025	Memorization	—Unverified	0
MMReason: An Open-Ended Multi-Modal Multi-Step Reasoning Benchmark for MLLMs Toward AGI	Jun 30, 2025	Memorization	CodeCode Available	0
Listener-Rewarded Thinking in VLMs for Image Preferences	Jun 28, 2025	MemorizationReinforcement Learning (RL)	—Unverified	0
Where to find Grokking in LLM Pretraining? Monitor Memorization-to-Generalization without Test	Jun 26, 2025	Code GenerationLarge Language Model	—Unverified	0
Leaner Training, Lower Leakage: Revisiting Memorization in LLM Fine-Tuning with LoRA	Jun 25, 2025	Memorization	—Unverified	0
Counterfactual Influence as a Distributional Quantity	Jun 25, 2025	counterfactualimage-classification	—Unverified	0
Uncovering Conceptual Blindspots in Generative Image Models Using Sparse Autoencoders	Jun 24, 2025	Memorization	—Unverified	0
A Random Matrix Analysis of In-context Memorization for Nonlinear Attention	Jun 23, 2025	Memorization	—Unverified	0
Robots and Children that Learn Together : Improving Knowledge Retention by Teaching Peer-Like Interactive Robots	Jun 23, 2025	MemorizationReinforcement Learning (RL)	—Unverified	0
In-Context Learning Strategies Emerge Rationally	Jun 21, 2025	In-Context LearningMemorization	—Unverified	0
Winter Soldier: Backdooring Language Models at Pre-Training with Indirect Data Poisoning	Jun 17, 2025	Data PoisoningMemorization	—Unverified	0
Capacity Matters: a Proof-of-Concept for Transformer Memorization on Real-World Data	Jun 17, 2025	Memorization	CodeCode Available	0
Dataset distillation for memorized data: Soft labels can leak held-out teacher knowledge	Jun 17, 2025	Dataset DistillationMemorization	CodeCode Available	0
Less is More: Undertraining Experts Improves Model Upcycling	Jun 17, 2025	Memorizationmodel	—Unverified	0
LexiMark: Robust Watermarking via Lexical Substitutions to Enhance Membership Verification of an LLM's Textual Training Data	Jun 17, 2025	Memorization	CodeCode Available	0
Sharpness-Aware Machine Unlearning	Jun 16, 2025	DenoisingMachine Unlearning	—Unverified	0
The SWE-Bench Illusion: When State-of-the-Art LLMs Remember Instead of Reason	Jun 14, 2025	DiagnosticMemorization	—Unverified	0
Restoring Gaussian Blurred Face Images for Deanonymization Attacks	Jun 14, 2025	DeblurringFace Anonymization	—Unverified	0
SoK: Data Reconstruction Attacks Against Machine Learning Models: Definition, Metrics, and Benchmark	Jun 9, 2025	DiversityMemorization	—Unverified	0
Private Memorization Editing: Turning Memorization into a Defense to Strengthen Data Privacy in Large Language Models	Jun 9, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
HeuriGym: An Agentic Benchmark for LLM-Crafted Heuristics in Combinatorial Optimization	Jun 9, 2025	Combinatorial OptimizationMemorization	CodeCode Available	2
Generative Modeling of Weights: Generalization or Memorization?	Jun 9, 2025	MemorizationVideo Generation	CodeCode Available	1
Diffusion models under low-noise regime	Jun 9, 2025	DenoisingMemorization	CodeCode Available	0
Simple Yet Effective: Extracting Private Data Across Clients in Federated Fine-Tuning of Large Language Models	Jun 6, 2025	Federated LearningMemorization	—Unverified	0
Quantifying Cross-Modality Memorization in Vision-Language Models	Jun 5, 2025	Machine UnlearningMemorization	—Unverified	0
Membership Inference Attacks on Sequence Models	Jun 5, 2025	Inference AttackMembership Inference Attack	—Unverified	0
Beyond Memorization: A Rigorous Evaluation Framework for Medical Knowledge Editing	Jun 4, 2025	knowledge editingMemorization	CodeCode Available	0
Trade-offs in Data Memorization via Strong Data Processing Inequalities	Jun 2, 2025	Binary ClassificationMemorization	—Unverified	0
How much do language models memorize?	May 30, 2025	Language ModelingLanguage Modelling	—Unverified	0
How does Transformer Learn Implicit Reasoning?	May 29, 2025	ClusteringDiagnostic	CodeCode Available	1
MathArena: Evaluating LLMs on Uncontaminated Math Competitions	May 29, 2025	MathMathematical Reasoning	CodeCode Available	3
Bayesian Perspective on Memorization and Reconstruction	May 29, 2025	Memorization	—Unverified	0
Benchmarking Abstract and Reasoning Abilities Through A Theoretical Perspective	May 28, 2025	BenchmarkingMemorization	CodeCode Available	0
Navigating the Latent Space Dynamics of Neural Models	May 28, 2025	Memorization	—Unverified	0
OWL: Probing Cross-Lingual Recall of Memorized Texts via World Literature	May 28, 2025	Memorization	CodeCode Available	0
Kernel-Smoothed Scores for Denoising Diffusion: A Bias-Variance Study	May 28, 2025	DenoisingMemorization	—Unverified	0
What is Adversarial Training for Diffusion Models?	May 27, 2025	Memorization	—Unverified	0
Memorization to Generalization: Emergence of Diffusion Models from Associative Memory	May 27, 2025	MemorizationRetrieval	—Unverified	0
Emergent LLM behaviors are observationally equivalent to data leakage	May 26, 2025	Memorization	CodeCode Available	0
Spurious Privacy Leakage in Neural Networks	May 26, 2025	Memorization	—Unverified	0
Grokking ExPLAIND: Unifying Model, Data, and Training Attribution to Study Model Behavior	May 26, 2025	AttributeMemorization	CodeCode Available	0
Understanding Generalization in Diffusion Models via Probability Flow Distance	May 26, 2025	Memorization	—Unverified	0
Querying Kernel Methods Suffices for Reconstructing their Training Data	May 25, 2025	Density EstimationMemorization	CodeCode Available	0
Discovering Forbidden Topics in Language Models	May 23, 2025	Memorization	—Unverified	0
Why Diffusion Models Don't Memorize: The Role of Implicit Dynamical Regularization in Training	May 23, 2025	Memorization	—Unverified	0
Memorization or Reasoning? Exploring the Idiom Understanding of LLMs	May 22, 2025	Machine TranslationMemorization	—Unverified	0
Sudoku-Bench: Evaluating creative reasoning with Sudoku variants	May 22, 2025	DiversityLogical Reasoning	CodeCode Available	0
Understanding Fact Recall in Language Models: Why Two-Stage Training Encourages Memorization but Mixed Training Teaches Knowledge	May 22, 2025	Memorization	—Unverified	0

Show:10 25 50

← PrevPage 1 of 22Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PaLM-540B (few-shot, k=5)	Accuracy	95.4	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	80	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	77.7	—	Unverified