Program Repair

Task of teaching ML models to modify an existing program to fix a bug in a given code.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 132 papers

Title	Date	Tasks	Status
RunBugRun -- An Executable Dataset for Automated Program Repair	Apr 3, 2023	Program Repair	—Unverified
SampleFix: Learning to Generate Functionally Diverse Fixes	Jun 24, 2019	DiversityProgram Repair	—Unverified
SCELMo: Source Code Embeddings from Language Models	Apr 28, 2020	Code SearchProgram Repair	—Unverified
SemAgent: A Semantics Aware Program Repair Agent	Jun 19, 2025	Program Repair	—Unverified
Semantic-guided Search for Efficient Program Repair with Large Language Models	Oct 22, 2024	GPUHumanEval	—Unverified
SmartPaste: Learning to Adapt Source Code	May 22, 2017	Machine TranslationProgram Repair	—Unverified
SWE-Synth: Synthesizing Verifiable Bug-Fix Data to Enable Large Language Models in Resolving Real-World Bugs	Apr 20, 2025	Program Repair	—Unverified
Synthetic Code Surgery: Repairing Bugs and Vulnerabilities with LLMs and Synthetic Data	May 12, 2025	Program RepairSynthetic Data Generation	—Unverified
T^3: Multi-level Tree-based Automatic Program Repair with Large Language Models	Jun 26, 2025	Program Repair	—Unverified
Tea: Program Repair Using Neural Network Based on Program Information Attention Matrix	Jul 17, 2021	Bug fixingProgram Repair	—Unverified
The Art of Repair: Optimizing Iterative Program Repair with Instruction-Tuned Models	May 5, 2025	HumanEvalProgram Repair	—Unverified
The Impact of Input Order Bias on Large Language Models for Software Fault Localization	Dec 25, 2024	Fault localizationMemorization	—Unverified
Towards Effectively Leveraging Execution Traces for Program Repair with Code LLMs	May 7, 2025	Program Repair	—Unverified
Towards Mixed Optimization for Reinforcement Learning with Program Synthesis	Jul 1, 2018	Deep Reinforcement LearningProgram Repair	—Unverified
Understanding Software Engineering Agents: A Study of Thought-Action-Result Trajectories	Jun 23, 2025	Large Language ModelProgram Repair	—Unverified
Using ML filters to help automated vulnerability repairs: when it helps and when it doesn't	Apr 9, 2025	Program RepairVulnerability Detection	—Unverified
Where's the Bug? Attention Probing for Scalable Fault Localization	Feb 19, 2025	Fault localizationProgram Repair	—Unverified
Improving Automated Program Repair with Domain Adaptation	Dec 21, 2022	Domain AdaptationProgram Repair	—Unverified
In-Context Code-Text Learning for Bimodal Software Engineering	Oct 8, 2024	Clone DetectionIn-Context Learning	—Unverified
Is ChatGPT the Ultimate Programming Assistant -- How far is it?	Apr 24, 2023	Code GenerationCode Summarization	—Unverified
Keep the Conversation Going: Fixing 162 out of 337 bugs for $0.42 each using ChatGPT	Apr 1, 2023	Program Repair	—Unverified
Learning to Fix Build Errors with Graph2Diff Neural Networks	Nov 4, 2019	DiagnosticGraph Neural Network	—Unverified
LessLeak-Bench: A First Investigation of Data Leakage in LLMs Across 83 Software Engineering Benchmarks	Feb 10, 2025	Code GenerationProgram Repair	—Unverified
Leveraging Causal Inference for Explainable Automatic Program Repair	May 26, 2022	Bug fixingCausal Inference	—Unverified
Better patching using LLM prompting, via Self-Consistency	May 31, 2023	Program Repair	—Unverified

Show:10 25 50

← PrevPage 4 of 6Next →

All datasets DeepFix GitHub-Python HumanEvalPack TFix's Code Patches Data

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DrRepair + BIFI	Average Success Rate	71.7	—	Unverified
2	DrRepair	Average Success Rate	68.2	—	Unverified
3	SampleFix	Average Success Rate	45.3	—	Unverified
4	RLAssist	Average Success Rate	26.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer + BIFI	Accuracy (%)	90.5	—	Unverified
2	Transformer	Accuracy (%)	62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MGDebugger (DeepSeek-Coder-V2-Lite)	Pass@1	97.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TFix	Error Removal	678	—	Unverified