SOTAVerified|Agents Browse Leaderboard About Blog

Fact Checking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11–20 of 669 papers

Title	Date	Tasks	Status	Hype	Score
Search Arena: Analyzing Search-Augmented LLMs	Jun 5, 2025	Fact Checking	CodeCode Available	2	5
SelfCheckGPT: Zero-Resource Black-Box Hallucination Detection for Generative Large Language Models	Mar 15, 2023	Fact CheckingHallucination	CodeCode Available	2	5
Multimodal Automated Fact-Checking: A Survey	May 22, 2023	Fact CheckingMisinformation	CodeCode Available	2	5
ChartGemma: Visual Instruction-tuning for Chart Reasoning in the Wild	Jul 4, 2024	Chart UnderstandingDecision Making	CodeCode Available	2	5
RETA-LLM: A Retrieval-Augmented Large Language Model Toolkit	Jun 8, 2023	Answer GenerationFact Checking	CodeCode Available	2	5
Atlas: Few-shot Learning with Retrieval Augmented Language Models	Aug 5, 2022	Fact CheckingFew-Shot Learning	CodeCode Available	2	5
FacTool: Factuality Detection in Generative AI -- A Tool Augmented Framework for Multi-Task and Multi-Domain Scenarios	Jul 25, 2023	Code GenerationFact Checking	CodeCode Available	2	5
KnowHalu: Hallucination Detection via Multi-Form Knowledge Based Factual Checking	Apr 3, 2024	Fact CheckingForm	CodeCode Available	2	5
BEIR: A Heterogenous Benchmark for Zero-shot Evaluation of Information Retrieval Models	Apr 17, 2021	Argument RetrievalBenchmarking	CodeCode Available	2	5
Scaling Language Models: Methods, Analysis & Insights from Training Gopher	Dec 8, 2021	Abstract AlgebraAnachronisms	CodeCode Available	2	5

Show:10 25 50

← PrevPage 2 of 67Next →

All datasets SciFact (BEIR)CLIMATE-FEVER (BEIR)FEVER (BEIR)AVeriTeC .CDCD LIAR2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	monoT5-3B	nDCG@10	0.78	—	Unverified
2	SGPT-BE-5.8B	nDCG@10	0.75	—	Unverified
3	BM25+CE	nDCG@10	0.69	—	Unverified
4	SGPT-CE-6.1B	nDCG@10	0.68	—	Unverified
5	ColBERT	nDCG@10	0.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SGPT-BE-5.8B	nDCG@10	0.31	—	Unverified
2	monoT5-3B	nDCG@10	0.28	—	Unverified
3	BM25+CE	nDCG@10	0.25	—	Unverified
4	SGPT-CE-6.1B	nDCG@10	0.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	monoT5-3B	nDCG@10	0.85	—	Unverified
2	BM25+CE	nDCG@10	0.82	—	Unverified
3	SGPT-BE-5.8B	nDCG@10	0.78	—	Unverified
4	SGPT-CE-6.1B	nDCG@10	0.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HerO	Question Only score	0.48	—	Unverified
2	CTU AIC	Question Only score	0.46	—	Unverified
3	InFact	Question Only score	0.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Abc	0..5sec	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MA-CIN	Precision	0.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FDHN	Accuracy (Test)	0.7	—	Unverified