Memorization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 1088 papers

Title	Date	Tasks	Status	Hype
What Should LLMs Forget? Quantifying Personal Data in LLMs for Right-to-Be-Forgotten Requests	Jul 15, 2025	Machine UnlearningMemorization	—Unverified	0
Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination	Jul 14, 2025	MathMathematical Reasoning	CodeCode Available	1
Entropy-Memorization Law: Evaluating Memorization Difficulty of Data in LLMs	Jul 8, 2025	Memorization	—Unverified	0
MMReason: An Open-Ended Multi-Modal Multi-Step Reasoning Benchmark for MLLMs Toward AGI	Jun 30, 2025	Memorization	CodeCode Available	0
Listener-Rewarded Thinking in VLMs for Image Preferences	Jun 28, 2025	MemorizationReinforcement Learning (RL)	—Unverified	0
Where to find Grokking in LLM Pretraining? Monitor Memorization-to-Generalization without Test	Jun 26, 2025	Code GenerationLarge Language Model	—Unverified	0
Leaner Training, Lower Leakage: Revisiting Memorization in LLM Fine-Tuning with LoRA	Jun 25, 2025	Memorization	—Unverified	0
Counterfactual Influence as a Distributional Quantity	Jun 25, 2025	counterfactualimage-classification	—Unverified	0
Uncovering Conceptual Blindspots in Generative Image Models Using Sparse Autoencoders	Jun 24, 2025	Memorization	—Unverified	0
A Random Matrix Analysis of In-context Memorization for Nonlinear Attention	Jun 23, 2025	Memorization	—Unverified	0
Robots and Children that Learn Together : Improving Knowledge Retention by Teaching Peer-Like Interactive Robots	Jun 23, 2025	MemorizationReinforcement Learning (RL)	—Unverified	0
In-Context Learning Strategies Emerge Rationally	Jun 21, 2025	In-Context LearningMemorization	—Unverified	0
Winter Soldier: Backdooring Language Models at Pre-Training with Indirect Data Poisoning	Jun 17, 2025	Data PoisoningMemorization	—Unverified	0
Less is More: Undertraining Experts Improves Model Upcycling	Jun 17, 2025	Memorizationmodel	—Unverified	0
Dataset distillation for memorized data: Soft labels can leak held-out teacher knowledge	Jun 17, 2025	Dataset DistillationMemorization	CodeCode Available	0
Capacity Matters: a Proof-of-Concept for Transformer Memorization on Real-World Data	Jun 17, 2025	Memorization	CodeCode Available	0
LexiMark: Robust Watermarking via Lexical Substitutions to Enhance Membership Verification of an LLM's Textual Training Data	Jun 17, 2025	Memorization	CodeCode Available	0
Sharpness-Aware Machine Unlearning	Jun 16, 2025	DenoisingMachine Unlearning	—Unverified	0
The SWE-Bench Illusion: When State-of-the-Art LLMs Remember Instead of Reason	Jun 14, 2025	DiagnosticMemorization	—Unverified	0
Restoring Gaussian Blurred Face Images for Deanonymization Attacks	Jun 14, 2025	DeblurringFace Anonymization	—Unverified	0
SoK: Data Reconstruction Attacks Against Machine Learning Models: Definition, Metrics, and Benchmark	Jun 9, 2025	DiversityMemorization	—Unverified	0
Private Memorization Editing: Turning Memorization into a Defense to Strengthen Data Privacy in Large Language Models	Jun 9, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
HeuriGym: An Agentic Benchmark for LLM-Crafted Heuristics in Combinatorial Optimization	Jun 9, 2025	Combinatorial OptimizationMemorization	CodeCode Available	2
Generative Modeling of Weights: Generalization or Memorization?	Jun 9, 2025	MemorizationVideo Generation	CodeCode Available	1
Diffusion models under low-noise regime	Jun 9, 2025	DenoisingMemorization	CodeCode Available	0

Show:10 25 50

← PrevPage 1 of 44Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PaLM-540B (few-shot, k=5)	Accuracy	95.4	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	80	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	77.7	—	Unverified