SOTAVerified|Agents Browse Leaderboard About Blog

Fact Checking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–110 of 669 papers

Title	Date	Tasks	Status	Hype
Truth or Mirage? Towards End-to-End Factuality Evaluation with LLM-Oasis	Nov 29, 2024	BenchmarkingClaim Verification	CodeCode Available	1
Do LLMs Understand Ambiguity in Text? A Case Study in Open-world Question Answering	Nov 19, 2024	Fact CheckingOpen-Domain Question Answering	—Unverified	0
ZeFaV: Boosting Large Language Models for Zero-shot Fact Verification	Nov 18, 2024	Fact CheckingFact Verification	CodeCode Available	0
Evaluating Large Language Model Capability in Vietnamese Fact-Checking Data Generation	Nov 8, 2024	Fact CheckingLanguage Modeling	—Unverified	0
Supporting Automated Fact-checking across Topics: Similarity-driven Gradual Topic Learning for Claim Detection	Nov 8, 2024	Domain AdaptationFact Checking	—Unverified	0
Ev2R: Evaluating Evidence Retrieval in Automated Fact-Checking	Nov 8, 2024	Fact Checkingnlg evaluation	—Unverified	0
Fact or Fiction? Can LLMs be Reliable Annotators for Political Truths?	Nov 8, 2024	ArticlesFact Checking	—Unverified	0
VERITAS: A Unified Approach to Reliability Evaluation	Nov 5, 2024	Fact CheckingHallucination	—Unverified	0
InFact: A Strong Baseline for Automated Fact-Checking	Nov 1, 2024	Claim VerificationFact Checking	—Unverified	0
Provenance: A Light-weight Fact-checker for Retrieval Augmented LLM Generation Output	Nov 1, 2024	Fact CheckingNatural Language Inference	—Unverified	0

Show:10 25 50

← PrevPage 11 of 67Next →

All datasets SciFact (BEIR)CLIMATE-FEVER (BEIR)FEVER (BEIR)AVeriTeC .CDCD LIAR2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	monoT5-3B	nDCG@10	0.78	—	Unverified
2	SGPT-BE-5.8B	nDCG@10	0.75	—	Unverified
3	BM25+CE	nDCG@10	0.69	—	Unverified
4	SGPT-CE-6.1B	nDCG@10	0.68	—	Unverified
5	ColBERT	nDCG@10	0.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SGPT-BE-5.8B	nDCG@10	0.31	—	Unverified
2	monoT5-3B	nDCG@10	0.28	—	Unverified
3	BM25+CE	nDCG@10	0.25	—	Unverified
4	SGPT-CE-6.1B	nDCG@10	0.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	monoT5-3B	nDCG@10	0.85	—	Unverified
2	BM25+CE	nDCG@10	0.82	—	Unverified
3	SGPT-BE-5.8B	nDCG@10	0.78	—	Unverified
4	SGPT-CE-6.1B	nDCG@10	0.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HerO	Question Only score	0.48	—	Unverified
2	CTU AIC	Question Only score	0.46	—	Unverified
3	InFact	Question Only score	0.45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Abc	0..5sec	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MA-CIN	Precision	0.26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FDHN	Accuracy (Test)	0.7	—	Unverified