Program Repair

Task of teaching ML models to modify an existing program to fix a bug in a given code.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 132 papers

Title	Date	Tasks	Status	Hype
Planning-Driven Programming: A Large Language Model Programming Workflow	Nov 21, 2024	Code GenerationHumanEval	CodeCode Available	1
A Comprehensive Survey of AI-Driven Advancements and Techniques in Automated Program Repair and Code Generation	Nov 12, 2024	Bug fixingCode Generation	—Unverified	0
MdEval: Massively Multilingual Code Debugging	Nov 4, 2024	Program Repair	—Unverified	0
Semantic-guided Search for Efficient Program Repair with Large Language Models	Oct 22, 2024	GPUHumanEval	—Unverified	0
Collu-Bench: A Benchmark for Predicting Language Model Hallucinations in Code	Oct 13, 2024	Code GenerationHallucination	—Unverified	0
In-Context Code-Text Learning for Bimodal Software Engineering	Oct 8, 2024	Clone DetectionIn-Context Learning	—Unverified	0
Exploring the Potential of Conversational Test Suite Based Program Repair on SWE-bench	Oct 6, 2024	Program Repairvalid	—Unverified	0
From Code to Correctness: Closing the Last Mile of Code Generation with Hierarchical Debugging	Oct 2, 2024	Auto DebuggingBug fixing	CodeCode Available	2
RepairBench: Leaderboard of Frontier Models for Program Repair	Sep 27, 2024	Program Repair	CodeCode Available	1
Can GPT-O1 Kill All Bugs? An Evaluation of GPT-Family LLMs on QuixBugs	Sep 16, 2024	AllProgram Repair	CodeCode Available	0
HyperAgent: Generalist Software Engineering Agents to Solve Coding Tasks at Scale	Sep 9, 2024	Code GenerationFault localization	CodeCode Available	3
Enhancing Automated Program Repair with Solution Design	Aug 22, 2024	Program Repair	—Unverified	0
RePair: Automated Program Repair with Process-based Feedback	Aug 21, 2024	Program Repair	CodeCode Available	0
MergeRepair: An Exploratory Study on Merging Task-Specific Adapters in Code LLMs for Automated Program Repair	Aug 18, 2024	parameter-efficient fine-tuningProgram Repair	—Unverified	0
SpecRover: Code Intent Extraction via LLMs	Aug 5, 2024	Code SearchLarge Language Model	—Unverified	0
Automated C/C++ Program Repair for High-Level Synthesis via Large Language Models	Jul 4, 2024	C++ codeCode Generation	—Unverified	0
Agentless: Demystifying LLM-based Software Engineering Agents	Jul 1, 2024	Program Repair	CodeCode Available	7
NARRepair: Non-Autoregressive Code Generation Model for Automatic Program Repair	Jun 24, 2024	Code GenerationProgram Repair	—Unverified	0
SemCoder: Training Code Language Models with Comprehensive Semantics Reasoning	Jun 3, 2024	Code CompletionCode Generation	CodeCode Available	1
Benchmarking Educational Program Repair	May 8, 2024	BenchmarkingProgram Repair	CodeCode Available	0
Automated Program Repair: Emerging trends pose and expose problems for benchmarks	May 8, 2024	Machine TranslationProgram Repair	—Unverified	0
Automatic Programming: Large Language Models and Beyond	May 3, 2024	Program Repair	—Unverified	0
NExT: Teaching Large Language Models to Reason about Code Execution	Apr 23, 2024	HumanEvalmbpp	—Unverified	0
Aligning the Objective of LLM-based Program Repair	Apr 13, 2024	Fault localizationProgram Repair	CodeCode Available	1
AutoCodeRover: Autonomous Program Improvement	Apr 8, 2024	Bug fixingCode Search	CodeCode Available	7

Show:10 25 50

← PrevPage 2 of 6Next →

All datasets DeepFix GitHub-Python HumanEvalPack TFix's Code Patches Data

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DrRepair + BIFI	Average Success Rate	71.7	—	Unverified
2	DrRepair	Average Success Rate	68.2	—	Unverified
3	SampleFix	Average Success Rate	45.3	—	Unverified
4	RLAssist	Average Success Rate	26.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer + BIFI	Accuracy (%)	90.5	—	Unverified
2	Transformer	Accuracy (%)	62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MGDebugger (DeepSeek-Coder-V2-Lite)	Pass@1	97.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TFix	Error Removal	678	—	Unverified