Program Repair

Task of teaching ML models to modify an existing program to fix a bug in a given code.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 132 papers

Title	Date	Tasks	Status
Attention Pruning: Automated Fairness Repair of Language Models via Surrogate Simulated Annealing	Mar 20, 2025	FairnessProgram Repair	—Unverified
Automated Bug Generation in the era of Large Language Models	Oct 3, 2023	Program Repair	—Unverified
Automated C/C++ Program Repair for High-Level Synthesis via Large Language Models	Jul 4, 2024	C++ codeCode Generation	—Unverified
Enhancing Automated Program Repair through Fine-tuning and Prompt Engineering	Apr 16, 2023	Program RepairPrompt Engineering	—Unverified
Automated Program Repair: Emerging trends pose and expose problems for benchmarks	May 8, 2024	Machine TranslationProgram Repair	—Unverified
Automatic Programming: Large Language Models and Beyond	May 3, 2024	Program Repair	—Unverified
BigIssue: A Realistic Bug Localization Benchmark	Jul 21, 2022	BIG-bench Machine LearningDiversity	—Unverified
Collu-Bench: A Benchmark for Predicting Language Model Hallucinations in Code	Oct 13, 2024	Code GenerationHallucination	—Unverified
ConDefects: A New Dataset to Address the Data Leakage Concern for LLM-based Fault Localization and Program Repair	Oct 25, 2023	BenchmarkingFault localization	—Unverified
Conversational Automated Program Repair	Jan 30, 2023	Program Repair	—Unverified
RAP-Gen: Retrieval-Augmented Patch Generation with CodeT5 for Automatic Program Repair	Sep 12, 2023	Language ModellingProgram Repair	—Unverified
Counterexample Guided Program Repair Using Zero-Shot Learning and MaxSAT-based Fault Localization	Dec 19, 2024	Fault localizationProgram Repair	—Unverified
DeepCode AI Fix: Fixing Security Vulnerabilities with Large Language Models	Feb 19, 2024	Code RepairFew-Shot Learning	—Unverified
DeepDebug: Fixing Python Bugs Using Stack Traces, Backtranslation, and Code Skeletons	May 19, 2021	Program Repair	—Unverified
Detect-Localize-Repair: A Unified Framework for Learning to Debug with CodeT5	Nov 27, 2022	Bug fixingLanguage Modeling	—Unverified
Dissecting the SWE-Bench Leaderboards: Profiling Submitters and Architectures of LLM- and Agent-Based Repair Systems	Jun 20, 2025	Program Repair	—Unverified
Dynamic Neural Program Embeddings for Program Repair	Jan 1, 2018	Code CompletionFault localization	—Unverified
Nova: Generative Language Models for Assembly Code with Hierarchical Attention and Contrastive Learning	Nov 22, 2023	Code GenerationCode Translation	—Unverified
Obstacles in Fully Automatic Program Repair: A survey	Nov 5, 2020	Program RepairSurvey	—Unverified
Peer-aided Repairer: Empowering Large Language Models to Repair Advanced Student Assignments	Apr 2, 2024	Language ModellingLarge Language Model	—Unverified
Program Repair with Minimal Edits Using CodeT5	Sep 26, 2023	Program Repair	—Unverified
Program Repair with Repeated Learning	Apr 24, 2021	Program Repair	—Unverified
Repairing Bugs in Python Assignments Using Large Language Models	Sep 29, 2022	ChunkingLanguage Modeling	—Unverified
Repair Is Nearly Generation: Multilingual Program Repair with LLMs	Aug 24, 2022	Language ModellingLarge Language Model	—Unverified
Revisiting the Plastic Surgery Hypothesis via Large Language Models	Mar 18, 2023	Program Repair	—Unverified
RunBugRun -- An Executable Dataset for Automated Program Repair	Apr 3, 2023	Program Repair	—Unverified
SampleFix: Learning to Generate Functionally Diverse Fixes	Jun 24, 2019	DiversityProgram Repair	—Unverified
SCELMo: Source Code Embeddings from Language Models	Apr 28, 2020	Code SearchProgram Repair	—Unverified
SemAgent: A Semantics Aware Program Repair Agent	Jun 19, 2025	Program Repair	—Unverified
Semantic-guided Search for Efficient Program Repair with Large Language Models	Oct 22, 2024	GPUHumanEval	—Unverified
SmartPaste: Learning to Adapt Source Code	May 22, 2017	Machine TranslationProgram Repair	—Unverified
SWE-Synth: Synthesizing Verifiable Bug-Fix Data to Enable Large Language Models in Resolving Real-World Bugs	Apr 20, 2025	Program Repair	—Unverified
Synthetic Code Surgery: Repairing Bugs and Vulnerabilities with LLMs and Synthetic Data	May 12, 2025	Program RepairSynthetic Data Generation	—Unverified
T^3: Multi-level Tree-based Automatic Program Repair with Large Language Models	Jun 26, 2025	Program Repair	—Unverified
Tea: Program Repair Using Neural Network Based on Program Information Attention Matrix	Jul 17, 2021	Bug fixingProgram Repair	—Unverified
The Art of Repair: Optimizing Iterative Program Repair with Instruction-Tuned Models	May 5, 2025	HumanEvalProgram Repair	—Unverified
The Impact of Input Order Bias on Large Language Models for Software Fault Localization	Dec 25, 2024	Fault localizationMemorization	—Unverified
Towards Effectively Leveraging Execution Traces for Program Repair with Code LLMs	May 7, 2025	Program Repair	—Unverified
Towards Mixed Optimization for Reinforcement Learning with Program Synthesis	Jul 1, 2018	Deep Reinforcement LearningProgram Repair	—Unverified
Understanding Software Engineering Agents: A Study of Thought-Action-Result Trajectories	Jun 23, 2025	Large Language ModelProgram Repair	—Unverified
Using ML filters to help automated vulnerability repairs: when it helps and when it doesn't	Apr 9, 2025	Program RepairVulnerability Detection	—Unverified
Where's the Bug? Attention Probing for Scalable Fault Localization	Feb 19, 2025	Fault localizationProgram Repair	—Unverified
Improving Automated Program Repair with Domain Adaptation	Dec 21, 2022	Domain AdaptationProgram Repair	—Unverified
In-Context Code-Text Learning for Bimodal Software Engineering	Oct 8, 2024	Clone DetectionIn-Context Learning	—Unverified
Is ChatGPT the Ultimate Programming Assistant -- How far is it?	Apr 24, 2023	Code GenerationCode Summarization	—Unverified
Keep the Conversation Going: Fixing 162 out of 337 bugs for $0.42 each using ChatGPT	Apr 1, 2023	Program Repair	—Unverified
Learning to Fix Build Errors with Graph2Diff Neural Networks	Nov 4, 2019	DiagnosticGraph Neural Network	—Unverified
LessLeak-Bench: A First Investigation of Data Leakage in LLMs Across 83 Software Engineering Benchmarks	Feb 10, 2025	Code GenerationProgram Repair	—Unverified
Leveraging Causal Inference for Explainable Automatic Program Repair	May 26, 2022	Bug fixingCausal Inference	—Unverified
Better patching using LLM prompting, via Self-Consistency	May 31, 2023	Program Repair	—Unverified

Show:10 25 50

← PrevPage 2 of 3Next →

All datasets DeepFix GitHub-Python HumanEvalPack TFix's Code Patches Data

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DrRepair + BIFI	Average Success Rate	71.7	—	Unverified
2	DrRepair	Average Success Rate	68.2	—	Unverified
3	SampleFix	Average Success Rate	45.3	—	Unverified
4	RLAssist	Average Success Rate	26.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer + BIFI	Accuracy (%)	90.5	—	Unverified
2	Transformer	Accuracy (%)	62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MGDebugger (DeepSeek-Coder-V2-Lite)	Pass@1	97.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TFix	Error Removal	678	—	Unverified