SOTAVerified|Agents Browse Leaderboard About Blog

Fact Checking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 21–30 of 669 papers

Title	Date	Tasks	Status	Hype
Debate-to-Detect: Reformulating Misinformation Detection as a Real-World Debate with Large Language Models	May 24, 2025	Binary ClassificationEthics	—Unverified	0
Teaching with Lies: Curriculum DPO on Synthetic Negatives for Hallucination Detection	May 23, 2025	Fact CheckingHallucination	—Unverified	0
Resolving Conflicting Evidence in Automated Fact-Checking: A Study on Retrieval-Augmented LLMs	May 23, 2025	Fact CheckingRAG	CodeCode Available	0
EMULATE: A Multi-Agent Framework for Determining the Veracity of Atomic Claims by Emulating Human Actions	May 22, 2025	Claim VerificationFact Checking	CodeCode Available	0
CUB: Benchmarking Context Utilisation Techniques for Language Models	May 22, 2025	BenchmarkingFact Checking	—Unverified	0
Improving the fact-checking performance of language models by relying on their entailment ability	May 21, 2025	Fact CheckingFact Verification	—Unverified	0
UrduFactCheck: An Agentic Fact-Checking Framework for Urdu with Evidence Boosting and Benchmarking	May 21, 2025	BenchmarkingClaim Verification	CodeCode Available	0
MultiHal: Multilingual Dataset for Knowledge-Graph Grounded Evaluation of LLM Hallucinations	May 20, 2025	Fact CheckingHallucination	CodeCode Available	0
Learning Auxiliary Tasks Improves Reference-Free Hallucination Detection in Open-Domain Long-Form Generation	May 18, 2025	Fact CheckingForm	—Unverified	0
SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrieval	May 15, 2025	Fact CheckingRetrieval	—Unverified	0

Show:10 25 50

← PrevPage 3 of 67Next →

All datasets SciFact (BEIR)CLIMATE-FEVER (BEIR)FEVER (BEIR)AVeriTeC .CDCD LIAR2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	monoT5-3B	nDCG@10	0.78	—	Unverified
2	SGPT-BE-5.8B	nDCG@10	0.75	—	Unverified
3	BM25+CE	nDCG@10	0.69	—	Unverified
4	SGPT-CE-6.1B	nDCG@10	0.68	—	Unverified
5	ColBERT	nDCG@10	0.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SGPT-BE-5.8B	nDCG@10	0.31	—	Unverified
2	monoT5-3B	nDCG@10	0.28	—	Unverified
3	BM25+CE	nDCG@10	0.25	—	Unverified
4	SGPT-CE-6.1B	nDCG@10	0.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	monoT5-3B	nDCG@10	0.85	—	Unverified
2	BM25+CE	nDCG@10	0.82	—	Unverified
3	SGPT-BE-5.8B	nDCG@10	0.78	—	Unverified
4	SGPT-CE-6.1B	nDCG@10	0.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HerO	Question Only score	0.48	—	Unverified
2	CTU AIC	Question Only score	0.46	—	Unverified
3	InFact	Question Only score	0.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Abc	0..5sec	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MA-CIN	Precision	0.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FDHN	Accuracy (Test)	0.7	—	Unverified