Vulnerability Detection

Vulnerability detection plays a crucial role in safeguarding against these threats by identifying weaknesses and potential entry points that malicious actors could exploit. Through advanced scanning techniques and penetration testing, vulnerability detection tools meticulously analyze web applications and websites for vulnerabilities such as SQL injection, cross-site scripting (XSS), and insecure authentication mechanisms.

By proactively identifying and addressing vulnerabilities, organizations can strengthen their online security posture and mitigate the risk of data breaches, financial loss, and reputational damage. Additionally, vulnerability detection empowers businesses to stay compliant with industry regulations and standards, demonstrating their commitment to safeguarding sensitive information and maintaining the trust of their customers. With the evolving threat landscape and increasingly sophisticated attack vectors, investing in robust vulnerability detection measures is paramount for staying one step ahead of cyber threats and ensuring the resilience of web-based platforms and services.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 216 papers

Title	Date	Tasks	Status	Hype
CORE: Benchmarking LLMs Code Reasoning Capabilities through Static Analysis Tasks	Jul 3, 2025	BenchmarkingCode Generation	—Unverified	0
SV-LLM: An Agentic Approach for SoC Security Verification using Large Language Models	Jun 25, 2025	Code GenerationIn-Context Learning	—Unverified	0
Smart-LLaMA-DPO: Reinforced Large Language Model for Explainable Smart Contract Vulnerability Detection	Jun 23, 2025	Language ModelingLanguage Modelling	—Unverified	0
Identifying Helpful Context for LLM-based Vulnerability Repair: A Preliminary Study	Jun 13, 2025	Vulnerability Detection	—Unverified	0
Today's Cat Is Tomorrow's Dog: Accounting for Time-Based Changes in the Labels of ML Vulnerability Detection Approaches	Jun 13, 2025	Vulnerability Detection	—Unverified	0
Boosting Vulnerability Detection of LLMs via Curriculum Preference Optimization with Synthetic Reasoning Data	Jun 9, 2025	Learning Semantic RepresentationsTriplet	CodeCode Available	0
Ai-Driven Vulnerability Analysis in Smart Contracts: Trends, Challenges and Future Directions	Jun 7, 2025	Vulnerability Detection	—Unverified	0
SafeGenBench: A Benchmark Framework for Security Vulnerability Detection in LLM-Generated Code	Jun 6, 2025	Code GenerationVulnerability Detection	—Unverified	0
Explainer-guided Targeted Adversarial Attacks against Binary Code Similarity Detection Models	Jun 5, 2025	Vulnerability Detection	—Unverified	0
A Multi-Dataset Evaluation of Models for Automated Vulnerability Repair	Jun 5, 2025	Program RepairVulnerability Detection	—Unverified	0
LPASS: Linear Probes as Stepping Stones for vulnerability detection using compressed LLMs	May 30, 2025	Vulnerability Detection	—Unverified	0
BugWhisperer: Fine-Tuning LLMs for SoC Hardware Vulnerability Detection	May 28, 2025	Language ModelingLanguage Modelling	—Unverified	0
SV-TrustEval-C: Evaluating Structure and Semantic Reasoning in Large Language Models for Source Code Vulnerability Analysis	May 27, 2025	Logical ReasoningVulnerability Detection	CodeCode Available	0
An Initial Exploration of Fine-tuning Small Language Models for Smart Contract Reentrancy Vulnerability Detection	May 25, 2025	Vulnerability Detection	—Unverified	0
CRAKEN: Cybersecurity LLM Agent with Knowledge-Based Execution	May 21, 2025	Large Language ModelTask Planning	CodeCode Available	1
Adaptive Plan-Execute Framework for Smart Contract Security Auditing	May 21, 2025	RAGRetrieval-augmented Generation	—Unverified	0
Leveraging Large Language Models for Command Injection Vulnerability Analysis in Python: An Empirical Study on Popular Open-Source Projects	May 21, 2025	Vulnerability Detection	—Unverified	0
Let the Trial Begin: A Mock-Court Approach to Vulnerability Detection using LLM-Based Agents	May 16, 2025	Vulnerability Detection	—Unverified	0
Are Sparse Autoencoders Useful for Java Function Bug Detection?	May 15, 2025	Code GenerationVulnerability Detection	CodeCode Available	0
Can You Really Trust Code Copilots? Evaluating Large Language Models from a Code Security Perspective	May 15, 2025	Code CompletionCode Generation	CodeCode Available	0
Enhancing Large Language Models with Faster Code Preprocessing for Vulnerability Detection	May 8, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
Program Semantic Inequivalence Game with Large Language Models	May 2, 2025	C++ codeCode Generation	CodeCode Available	0
Enhancing the Cloud Security through Topic Modelling	May 1, 2025	Vulnerability Detection	—Unverified	0
LLMpatronous: Harnessing the Power of LLMs For Vulnerability Detection	Apr 25, 2025	Feature EngineeringRAG	—Unverified	0
Case Study: Fine-tuning Small Language Models for Accurate and Private CWE Detection in Python Code	Apr 23, 2025	Instruction FollowingPrivacy Preserving	—Unverified	0
A Study on Mixup-Inspired Augmentation Methods for Software Vulnerability Detection	Apr 22, 2025	Code SearchVulnerability Detection	—Unverified	0
C2RUST-BENCH: A Minimized, Representative Dataset for C-to-Rust Transpilation Evaluation	Apr 21, 2025	Vulnerability Detection	—Unverified	0
AI-Based Vulnerability Analysis of NFT Smart Contracts	Apr 18, 2025	Vulnerability Detection	—Unverified	0
Trace Gadgets: Minimizing Code Context for Machine Learning-Based Vulnerability Prediction	Apr 18, 2025	Vulnerability Detection	—Unverified	0
The Hitchhiker's Guide to Program Analysis, Part II: Deep Thoughts by LLMs	Apr 16, 2025	Vulnerability Detection	CodeCode Available	1
Using ML filters to help automated vulnerability repairs: when it helps and when it doesn't	Apr 9, 2025	Program RepairVulnerability Detection	—Unverified	0
R2Vul: Learning to Reason about Software Vulnerabilities with Reinforcement Learning and Structured Reasoning Distillation	Apr 7, 2025	validVulnerability Detection	CodeCode Available	1
Responsible Development of Offensive AI	Apr 3, 2025	Vulnerability Detection	CodeCode Available	0
Reasoning Under Threat: Symbolic and Neural Techniques for Cybersecurity Verification	Mar 27, 2025	Automated Theorem ProvingFormal Logic	—Unverified	0
Enhancing Software Vulnerability Detection Using Code Property Graphs and Convolutional Neural Networks	Mar 23, 2025	Vulnerability Detection	—Unverified	0
Reasoning with LLMs for Zero-Shot Vulnerability Detection	Mar 22, 2025	Vulnerability Detection	CodeCode Available	0
Computing Modes of Instability of Parameterized Nonlinear Systems for Vulnerability Assessment	Mar 16, 2025	Numerical IntegrationVulnerability Detection	—Unverified	0
Vulnerability Detection: From Formal Verification to Large Language Models and Hybrid Approaches: A Comprehensive Overview	Mar 13, 2025	Automated Theorem Provingsoftware testing	—Unverified	0
CASTLE: Benchmarking Dataset for Static Code Analyzers and LLMs towards CWE Detection	Mar 12, 2025	BenchmarkingCode Classification	CodeCode Available	1
Evaluating LLaMA 3.2 for Software Vulnerability Detection	Mar 10, 2025	Language ModelingLanguage Modelling	—Unverified	0
MTVHunter: Smart Contracts Vulnerability Detection Based on Multi-Teacher Knowledge Translation	Feb 24, 2025	DenoisingVulnerability Detection	CodeCode Available	0
A Multi-Agent Framework for Automated Vulnerability Detection and Repair in Solidity and Move Smart Contracts	Feb 22, 2025	Vulnerability Detection	—Unverified	0
SmartLLM: Smart Contract Auditing using Custom Generative AI	Feb 17, 2025	Language ModelingLanguage Modelling	—Unverified	0
LLMs in Software Security: A Survey of Vulnerability Detection Techniques and Insights	Feb 10, 2025	Data IntegrationVulnerability Detection	CodeCode Available	0
Large Language Models for In-File Vulnerability Localization Can Be "Lost in the End"	Feb 9, 2025	Vulnerability Detection	—Unverified	0
Evaluating Large Language Models in Vulnerability Detection Under Variable Context Windows	Jan 30, 2025	Vulnerability Detection	—Unverified	0
Automating the Detection of Code Vulnerabilities by Analyzing GitHub Issues	Jan 9, 2025	Vulnerability Detection	—Unverified	0
CGP-Tuning: Structure-Aware Soft Prompt Tuning for Code Vulnerability Detection	Jan 8, 2025	Computational Efficiencycross-modal alignment	—Unverified	0
How to Select Pre-Trained Code Models for Reuse? A Learning Perspective	Jan 7, 2025	Code GenerationCode Summarization	—Unverified	0
Investigating Large Language Models for Code Vulnerability Detection: An Experimental Study	Dec 24, 2024	Vulnerability Detection	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 5Next →

All datasets VulScribeR Vulnerability Java Dataset

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Reveal Model - Tested on Reveal (Training on Devign + VulScribeR 20K + Extra Cleans)	F1 Score	26.18	—	Unverified
2	Devign Model - Tested on Reveal (Training on Devign + VulScribeR 20K + Extra Cleans)	F1 Score	24.99	—	Unverified
3	Reveal Model - Tested on Bigvul (Training on Devign + VulScribeR 20K + Extra Cleans)	F1 Score	18.98	—	Unverified
4	Devign Model - Tested on Bigvul (Training on Devign + VulScribeR 20K + Extra Cleans)	F1 Score	18.51	—	Unverified
5	LineVul - Tested on Reveal (Training on Devign + VulScribeR 20K + Extra Cleans)	F1 Score	17.38	—	Unverified
6	LineVul - Tested on BigVul (Training on Devign + VulScribeR 20K+ Extra Cleans)	F1 Score	16.23	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WizardCoder	AUC	0.86	—	Unverified
2	ContraBERT	AUC	0.85	—	Unverified