Model Editing

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–193 of 193 papers

Title	Date	Tasks	Status
Localized Definitions and Distributed Reasoning: A Proof-of-Concept Mechanistic Interpretability Study via Activation Patching	Apr 3, 2025	Answer GenerationEEG	CodeCode Available
Long-form evaluation of model editing	Feb 14, 2024	Formmodel	CodeCode Available
LyapLock: Bounded Knowledge Preservation in Sequential Large Language Model Editing	May 21, 2025	Language ModelingLanguage Modelling	CodeCode Available
Learning Where to Edit Vision Transformers	Nov 4, 2024	Meta-LearningModel Editing	CodeCode Available
Resolving Lexical Bias in Edit Scoping with Projector Editor Networks	Aug 19, 2024	Contrastive LearningModel Editing	CodeCode Available
The Butterfly Effect of Model Editing: Few Edits Can Trigger Large Language Models Collapse	Feb 15, 2024	BenchmarkingModel Editing	CodeCode Available
MELO: Enhancing Model Editing with Neuron-Indexed Dynamic LoRA	Dec 19, 2023	Document ClassificationHallucination	CodeCode Available
Leaking LoRa: An Evaluation of Password Leaks and Knowledge Storage in Large Language Models	Mar 29, 2025	Language ModelingLanguage Modelling	CodeCode Available
Understanding the Collapse of LLMs in Model Editing	Jun 17, 2024	Model Editing	CodeCode Available
Editing Factual Knowledge and Explanatory Ability of Medical Large Language Models	Feb 28, 2024	BenchmarkingHallucination	CodeCode Available
Language Anisotropic Cross-Lingual Model Editing	May 25, 2022	modelModel Editing	CodeCode Available
On the Robustness of Editing Large Language Models	Feb 8, 2024	Model EditingText Generation	CodeCode Available
Cross-lingual Editing in Multilingual Language Models	Jan 19, 2024	Model Editing	CodeCode Available
Unveiling Concept Attribution in Diffusion Models	Dec 3, 2024	Model Editing	CodeCode Available
Mitigating Safety Fallback in Editing-based Backdoor Injection on LLMs	Jun 16, 2025	DiversityModel Editing	CodeCode Available
Mitigating the Language Mismatch and Repetition Issues in LLM-based Machine Translation via Model Editing	Oct 9, 2024	Machine TranslationModel Editing	CodeCode Available
Model Editing as a Double-Edged Sword: Steering Agent Ethical Behavior Toward Beneficence or Harm	Jun 25, 2025	Model Editing	CodeCode Available
Model Editing at Scale leads to Gradual and Catastrophic Forgetting	Jan 15, 2024	Model EditingSpecificity	CodeCode Available
Editing Common Sense in Transformers	May 24, 2023	Common Sense ReasoningModel Editing	CodeCode Available
A cost-effective method for improving and re-purposing large, pre-trained GANs by fine-tuning their class-embeddings	Oct 10, 2019	DiversityModel Editing	CodeCode Available
How (un)ethical are instruction-centric responses of LLMs? Unveiling the vulnerabilities of safety guardrails to harmful queries	Feb 23, 2024	Model EditingResponse Generation	CodeCode Available
What does the Knowledge Neuron Thesis Have to do with Knowledge?	May 3, 2024	Model Editing	CodeCode Available
Model Editing for LLMs4Code: How Far are We?	Nov 11, 2024	16kCode Generation	CodeCode Available
Gradient Rewiring for Editable Graph Neural Network Training	Oct 21, 2024	Graph Neural NetworkModel Editing	CodeCode Available
WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models	May 23, 2024	HallucinationModel Editing	CodeCode Available
Fundamental Problems With Model Editing: How Should Rational Belief Revision Work in LLMs?	Jun 27, 2024	Model EditingPhilosophy	CodeCode Available
Scalable Model Editing via Customized Expert Networks	Apr 3, 2024	Hallucinationmodel	CodeCode Available
Consecutive Batch Model Editing with HooK Layers	Mar 8, 2024	modelModel Editing	CodeCode Available
UniErase: Unlearning Token as a Universal Erasure Primitive for Language Models	May 21, 2025	Machine UnlearningModel Editing	CodeCode Available
Concept-ROT: Poisoning Concepts in Large Language Models with Model Editing	Dec 17, 2024	MisinformationModel Editing	CodeCode Available
NAMET: Robust Massive Model Editing via Noise-Aware Memory Optimization	May 17, 2025	AttributeModel Editing	CodeCode Available
Forget Vectors at Play: Universal Input Perturbations Driving Machine Unlearning in Image Classification	Dec 21, 2024	image-classificationImage Classification	CodeCode Available
Should We Really Edit Language Models? On the Evaluation of Edited Language Models	Oct 24, 2024	General KnowledgeModel Editing	CodeCode Available
CoME: An Unlearning-based Approach to Conflict-free Model Editing	Feb 20, 2025	Model Editing	CodeCode Available
"Flex Tape Can't Fix That": Bias and Misinformation in Edited Language Models	Feb 29, 2024	MisinformationModel Editing	CodeCode Available
Can We Edit Multimodal Large Language Models?	Oct 12, 2023	Model Editing	CodeCode Available
Parameter-tuning-free data entry error unlearning with adaptive selective synaptic dampening	Feb 6, 2024	Model Editing	CodeCode Available
Expose Before You Defend: Unifying and Enhancing Backdoor Defenses via Exposed Models	Oct 25, 2024	backdoor defenseModel Editing	CodeCode Available
ELDER: Enhancing Lifelong Model Editing with Mixture-of-LoRA	Aug 19, 2024	Model Editing	CodeCode Available
Sowing the Wind, Reaping the Whirlwind: The Impact of Editing Language Models	Jan 19, 2024	Model EditingRed Teaming	CodeCode Available
Drop Dropout on Single-Epoch Language Model Pretraining	May 30, 2025	Language ModelingLanguage Modelling	CodeCode Available
DAFNet: Dynamic Auxiliary Fusion for Sequential Model Editing in Large Language Models	May 31, 2024	HallucinationModel Editing	CodeCode Available
Stealth edits to large language models	Jun 18, 2024	Language ModellingModel Editing	CodeCode Available

Show:10 25 50

← PrevPage 4 of 4Next →

No leaderboard results yet.