Code Search

The goal of Code Search is to retrieve code fragments from a large code corpus that most closely match a developer’s intent, which is expressed in natural language.

Source: When Deep Learning Met Code Search

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 125 papers

Title	Date	Tasks	Status
Repository-level Code Search with Neural Retrieval Methods	Feb 10, 2025	Bug fixingCode Search	CodeCode Available
OrcaLoca: An LLM Agent Framework for Software Issue Localization	Feb 1, 2025	Code SearchLanguage Modeling	—Unverified
On the Compression of Language Models for Code: An Empirical Study on CodeBERT	Dec 18, 2024	Code SearchCode Summarization	—Unverified
Isotropy Matters: Soft-ZCA Whitening of Embeddings for Semantic Code Search	Nov 26, 2024	Code Search	CodeCode Available
In-the-loop Hyper-Parameter Optimization for LLM-Based Automated Design of Heuristics	Oct 7, 2024	Code GenerationCode Search	—Unverified
Deep Code Search with Naming-Agnostic Contrastive Multi-View Learning	Aug 18, 2024	Code SearchContrastive Learning	—Unverified
Natural Language Outlines for Code: Literate Programming in the LLM Era	Aug 9, 2024	Code GenerationCode Search	—Unverified
LLM Agents Improve Semantic Code Search	Aug 5, 2024	Code SearchRAG	—Unverified
SpecRover: Code Intent Extraction via LLMs	Aug 5, 2024	Code SearchLarge Language Model	—Unverified
Toward Exploring the Code Understanding Capabilities of Pre-trained Code Generation Models	Jun 18, 2024	Clone DetectionCode Generation	—Unverified
CoSQA+: Pioneering the Multi-Choice Code Search Benchmark with Test-Driven Agents	Jun 17, 2024	Code GenerationCode Search	CodeCode Available
ProCQA: A Large-scale Community-based Programming Question Answering Dataset for Code Search	Mar 25, 2024	Code SearchQuestion Answering	CodeCode Available
Code Search Debiasing:Improve Search Results beyond Overall Ranking Performance	Nov 25, 2023	Code SearchReranking	—Unverified
GenCodeSearchNet: A Benchmark Test Suite for Evaluating Generalization in Programming Language Understanding	Nov 16, 2023	Code CompletionCode Generation	CodeCode Available
TransformCode: A Contrastive Learning Framework for Code Embedding via Subtree Transformation	Nov 10, 2023	Clone DetectionCode Search	CodeCode Available
Noisy Pair Corrector for Dense Retrieval	Nov 7, 2023	Code SearchRetrieval	—Unverified
ACES: Generating Diverse Programming Puzzles with with Autotelic Generative Models	Oct 15, 2023	Code SearchDiversity	—Unverified
Contrastive Prompt Learning-based Code Search based on Interaction Matrix	Oct 10, 2023	Code SearchContrastive Learning	—Unverified
Code Representation Pre-training with Complements from Program Executions	Sep 4, 2023	Code SearchLanguage Modeling	—Unverified
Laminar: A New Serverless Stream-based Framework with Semantic Code Search and Code Completion	Sep 1, 2023	Code CompletionCode Search	—Unverified
MELT: Mining Effective Lightweight Transformations from Pull Requests	Aug 28, 2023	Code Search	CodeCode Available
Evaluating and Optimizing the Effectiveness of Neural Machine Translation in Supporting Code Retrieval Models: A Study on the CAT Benchmark	Aug 9, 2023	Code SearchCode Translation	—Unverified
Constructing Multilingual Code Search Dataset Using Neural Machine Translation	Jun 27, 2023	Code SearchMachine Translation	CodeCode Available
CCT-Code: Cross-Consistency Training for Multilingual Clone Detection and Code Search	May 19, 2023	Clone DetectionCode Search	—Unverified
Searching by Code: a New SearchBySnippet Dataset and SnippeR Retrieval Model for Searching by Code Snippets	May 19, 2023	Code SearchRetrieval	—Unverified
CodeT5+: Open Code Large Language Models for Code Understanding and Generation	May 13, 2023	Arithmetic ReasoningCode Completion	CodeCode Available
Code Execution with Pre-trained Language Models	May 8, 2023	Code GenerationCode Search	—Unverified
REINFOREST: Reinforcing Semantic Code Similarity for Cross-Lingual Code Search Models	May 5, 2023	Code SearchContrastive Learning	CodeCode Available
Neuro-symbolic Zero-Shot Code Cloning with Cross-Language Intermediate Representation	Apr 26, 2023	C++ codeCode Search	—Unverified
Unveiling Code Pre-Trained Models: Investigating Syntax and Semantics Capacities	Dec 20, 2022	Code CompletionCode Search	—Unverified
You Don't Know Search: Helping Users Find Code by Automatically Evaluating Alternative Queries	Dec 7, 2022	Code Search	—Unverified
Global Contrastive Batch Sampling via Optimization on Sample Permutations	Oct 23, 2022	Code SearchContrastive Learning	CodeCode Available
CodeDSI: Differentiable Code Search	Oct 1, 2022	Code GenerationCode Search	—Unverified
CSSAM:Code Search via Attention Matching of Code Semantics and Structures	Aug 8, 2022	Code SearchDescriptive	—Unverified
NS3: Neuro-Symbolic Semantic Code Search	May 21, 2022	Code SearchQuestion Answering	CodeCode Available
CoCoSoDa: Effective Contrastive Learning for Code Search	Apr 7, 2022	Code SearchContrastive Learning	—Unverified
On the Transferability of Pre-trained Language Models for Low-Resource Programming Languages	Apr 5, 2022	Code SearchCode Summarization	—Unverified
Accelerating Code Search with Deep Hashing and Code Classification	Mar 29, 2022	ClassificationCode Classification	—Unverified
What Do They Capture? -- A Structural Analysis of Pre-Trained Language Models for Source Code	Feb 14, 2022	Code CompletionCode Search	—Unverified
CodeRetriever: Unimodal and Bimodal Contrastive Learning for Code Search	Jan 26, 2022	Code SearchContrastive Learning	—Unverified
Generating Clarifying Questions for Query Refinement in Source Code Search	Jan 24, 2022	Code Search	CodeCode Available
AstBERT: Enabling Language Model for Financial Code Understanding with Abstract Syntax Trees	Jan 20, 2022	Clone DetectionCode Search	—Unverified
Analyzing CodeBERT's Performance on Natural Language Code Search	Jan 16, 2022	Code Search	—Unverified
Better Modeling the Programming World with Code Concept Graphs-augmented Multi-modal Learning	Jan 10, 2022	Code SearchGraph Neural Network	—Unverified
Energy-bounded Learning for Robust Models of Code	Dec 20, 2021	Code ClassificationCode Search	—Unverified
EDAssistant: Supporting Exploratory Data Analysis in Computational Notebooks with In-Situ Code Search and Recommendation	Dec 15, 2021	Code Search	—Unverified
Semantic Code Search for Smart Contracts	Nov 28, 2021	Code Search	—Unverified
A New Search Paradigm for Natural Language Code Search	Nov 16, 2021	Code Search	—Unverified
CodeRetriever: Unimodal and Bimodal Contrastive Learning for Code Search	Nov 16, 2021	Code SearchContrastive Learning	—Unverified
Cascaded Fast and Slow Models for Efficient Semantic Code Search	Oct 15, 2021	Code SearchRe-Ranking	—Unverified

Show:10 25 50

← PrevPage 2 of 3Next →

All datasets CodeSearchNet CoDesc CodeXGLUE - AdvTest CodeSearchNet - Ruby CodeXGLUE - WebQueryTest CoIR

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	cpt-code M	Overall	93.5	—	Unverified
2	cpt-code S	Overall	93.4	—	Unverified
3	CodeT5+ 770M	Overall	77.4	—	Unverified
4	GraphCodeBERT	Overall	77.4	—	Unverified
5	CodeT5+ 220M	Overall	77.1	—	Unverified
6	CodeBERT	Overall	76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Self-attention	Test MRR	0.84	—	Unverified
2	NBOW	Test MRR	0.81	—	Unverified
3	RNN	Test MRR	0.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CodeT5+ 770M	MRR	44.7	—	Unverified
2	CodeT5+ 220M	MRR	43.3	—	Unverified
3	CodeBERT	MRR	27.19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Uni-SBT	MRR	0.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CodeBERT	Accuracy	47.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Voyage-code-002	nDCG@10	56.26	—	Unverified