SOTAVerified|Agents Browse Leaderboard About Blog

Fact Checking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 669 papers

Title	Date	Tasks	Status	Hype	Score
MiniCheck: Efficient Fact-Checking of LLMs on Grounding Documents	Apr 16, 2024	Fact CheckingRetrieval-augmented Generation	CodeCode Available	7	5
Semantic Operators: A Declarative Model for Rich, AI-based Data Processing	Jul 16, 2024	Extreme Multi-Label ClassificationFact Checking	CodeCode Available	5	5
Loki: An Open-Source Tool for Fact Verification	Oct 2, 2024	Claim VerificationFact Checking	CodeCode Available	5	5
Medical Graph RAG: Towards Safe Medical Large Language Model via Graph Retrieval-Augmented Generation	Aug 8, 2024	ChunkingFact Checking	CodeCode Available	4	5
Don't Ignore Dual Logic Ability of LLMs while Privatizing: A Data-Intensive Analysis in Medical Domain	Sep 8, 2023	Fact CheckingKnowledge Graphs	CodeCode Available	4	5
Verdict: A Library for Scaling Judge-Time Compute	Feb 25, 2025	Fact CheckingHallucination	CodeCode Available	3	5
SemViQA: A Semantic Question Answering System for Vietnamese Information Fact-Checking	Mar 2, 2025	Fact CheckingFact Verification	CodeCode Available	2	5
Atlas: Few-shot Learning with Retrieval Augmented Language Models	Aug 5, 2022	Fact CheckingFew-Shot Learning	CodeCode Available	2	5
KnowHalu: Hallucination Detection via Multi-Form Knowledge Based Factual Checking	Apr 3, 2024	Fact CheckingForm	CodeCode Available	2	5
ChartGemma: Visual Instruction-tuning for Chart Reasoning in the Wild	Jul 4, 2024	Chart UnderstandingDecision Making	CodeCode Available	2	5

Show:10 25 50

← PrevPage 1 of 67Next →

All datasets SciFact (BEIR)CLIMATE-FEVER (BEIR)FEVER (BEIR)AVeriTeC .CDCD LIAR2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	monoT5-3B	nDCG@10	0.78	—	Unverified
2	SGPT-BE-5.8B	nDCG@10	0.75	—	Unverified
3	BM25+CE	nDCG@10	0.69	—	Unverified
4	SGPT-CE-6.1B	nDCG@10	0.68	—	Unverified
5	ColBERT	nDCG@10	0.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SGPT-BE-5.8B	nDCG@10	0.31	—	Unverified
2	monoT5-3B	nDCG@10	0.28	—	Unverified
3	BM25+CE	nDCG@10	0.25	—	Unverified
4	SGPT-CE-6.1B	nDCG@10	0.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	monoT5-3B	nDCG@10	0.85	—	Unverified
2	BM25+CE	nDCG@10	0.82	—	Unverified
3	SGPT-BE-5.8B	nDCG@10	0.78	—	Unverified
4	SGPT-CE-6.1B	nDCG@10	0.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HerO	Question Only score	0.48	—	Unverified
2	CTU AIC	Question Only score	0.46	—	Unverified
3	InFact	Question Only score	0.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Abc	0..5sec	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MA-CIN	Precision	0.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FDHN	Accuracy (Test)	0.7	—	Unverified