Vulnerability Detection

Vulnerability detection plays a crucial role in safeguarding against these threats by identifying weaknesses and potential entry points that malicious actors could exploit. Through advanced scanning techniques and penetration testing, vulnerability detection tools meticulously analyze web applications and websites for vulnerabilities such as SQL injection, cross-site scripting (XSS), and insecure authentication mechanisms.

By proactively identifying and addressing vulnerabilities, organizations can strengthen their online security posture and mitigate the risk of data breaches, financial loss, and reputational damage. Additionally, vulnerability detection empowers businesses to stay compliant with industry regulations and standards, demonstrating their commitment to safeguarding sensitive information and maintaining the trust of their customers. With the evolving threat landscape and increasingly sophisticated attack vectors, investing in robust vulnerability detection measures is paramount for staying one step ahead of cyber threats and ensuring the resilience of web-based platforms and services.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 216 papers

Title	Date	Tasks	Status	Hype
NYU CTF Bench: A Scalable Open-Source Benchmark Dataset for Evaluating LLMs in Offensive Security	Jun 8, 2024	Task PlanningVulnerability Detection	CodeCode Available	11
Vulnerability Detection with Code Language Models: How Far Are We?	Mar 27, 2024	Vulnerability Detection	CodeCode Available	3
MoreFixes: A Large-Scale Dataset of CVE Fix Commits Mined through Enhanced Repository Discovery	Jul 10, 2024	Vulnerability Detection	CodeCode Available	2
An LLM-Assisted Easy-to-Trigger Backdoor Attack on Code Completion Models: Injecting Disguised Vulnerabilities against Strong Detection	Jun 10, 2024	Backdoor AttackCode Completion	CodeCode Available	2
Generalization-Enhanced Code Vulnerability Detection via Multi-Task Instruction Fine-Tuning	Jun 6, 2024	Multi-Task LearningVulnerability Detection	CodeCode Available	2
Finetuning Large Language Models for Vulnerability Detection	Jan 30, 2024	Transfer LearningVulnerability Detection	CodeCode Available	2
CRAKEN: Cybersecurity LLM Agent with Knowledge-Based Execution	May 21, 2025	Large Language ModelTask Planning	CodeCode Available	1
The Hitchhiker's Guide to Program Analysis, Part II: Deep Thoughts by LLMs	Apr 16, 2025	Vulnerability Detection	CodeCode Available	1
R2Vul: Learning to Reason about Software Vulnerabilities with Reinforcement Learning and Structured Reasoning Distillation	Apr 7, 2025	validVulnerability Detection	CodeCode Available	1
CASTLE: Benchmarking Dataset for Static Code Analyzers and LLMs towards CWE Detection	Mar 12, 2025	BenchmarkingCode Classification	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 22Next →

All datasets VulScribeR Vulnerability Java Dataset

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Reveal Model - Tested on Reveal (Training on Devign + VulScribeR 20K + Extra Cleans)	F1 Score	26.18	—	Unverified
2	Devign Model - Tested on Reveal (Training on Devign + VulScribeR 20K + Extra Cleans)	F1 Score	24.99	—	Unverified
3	Reveal Model - Tested on Bigvul (Training on Devign + VulScribeR 20K + Extra Cleans)	F1 Score	18.98	—	Unverified
4	Devign Model - Tested on Bigvul (Training on Devign + VulScribeR 20K + Extra Cleans)	F1 Score	18.51	—	Unverified
5	LineVul - Tested on Reveal (Training on Devign + VulScribeR 20K + Extra Cleans)	F1 Score	17.38	—	Unverified
6	LineVul - Tested on BigVul (Training on Devign + VulScribeR 20K+ Extra Cleans)	F1 Score	16.23	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WizardCoder	AUC	0.86	—	Unverified
2	ContraBERT	AUC	0.85	—	Unverified