SOTAVerified|Agents Browse Leaderboard About

Explanation Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 91–100 of 235 papers

Title	Date	Tasks	Status	Hype	Score
Tell Me Why: Explainable Public Health Fact-Checking with Large Language Models	May 15, 2024	Explanation GenerationFact Checking	CodeCode Available	0	5
Enriching Visual with Verbal Explanations for Relational Concepts -- Combining LIME with Aleph	Oct 4, 2019	Explanation GenerationInductive logic programming	—Unverified	0	0
Calibrating Trust of Multi-Hop Question Answering Systems with Decompositional Probes	Apr 16, 2022	Explanation GenerationMulti-hop Question Answering	—Unverified	0	0
Enhancing Emotion Prediction in News Headlines: Insights from ChatGPT and Seq2Seq Models for Free-Text Generation	Jul 14, 2024	ClassificationEmotion Classification	—Unverified	0	0
Breaking Common Sense: WHOOPS! A Vision-and-Language Benchmark of Synthetic and Compositional Images	Mar 13, 2023	Common Sense ReasoningExplanation Generation	—Unverified	0	0
E-KAR: A Benchmark for Rationalizing Natural Language Analogical Reasoning	Mar 16, 2022	Explanation GenerationQuestion Answering	—Unverified	0	0
E-KAR: A Benchmark for Rationalizing Natural Language Analogical Reasoning	Nov 16, 2021	Explanation GenerationQuestion Answering	—Unverified	0	0
EGCR: Explanation Generation for Conversational Recommendation	Aug 17, 2022	Conversational RecommendationExplanation Generation	—Unverified	0	0
Boosting Knowledge Graph-based Recommendations through Confidence-Aware Augmentation with Large Language Models	Feb 6, 2025	Contrastive LearningExplanation Generation	—Unverified	0	0
Are Training Resources Insufficient? Predict First Then Explain!	Aug 29, 2021	Decision MakingExplanation Generation	—Unverified	0	0

Show:10 25 50

← PrevPage 10 of 24Next →

All datasets WHOOPS!CLEVR-X e-SNLI-VE VCR VQA-X

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	VLIS (Lynx)	Accuracy	80	—	Unverified
2	VLIS (LLaVA)	Accuracy	73	—	Unverified
3	Ground-truth Caption -> GPT3 (Oracle)	Human (%)	68	—	Unverified
4	Predicted Caption -> GPT3	Human (%)	33	—	Unverified
5	BLIP2 FlanT5-XXL (Fine-tuned)	Human (%)	27	—	Unverified
6	BLIP2 FlanT5-XL (Fine-tuned)	Human (%)	15	—	Unverified
7	BLIP2 FlanT5-XXL (Zero-shot)	Human (%)	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PJ-X	B4	87.4	—	Unverified
2	FM	B4	78.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OFA-X	Human Explanation Rating	85.7	—	Unverified
2	OFA-X-MT	Human Explanation Rating	80.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OFA-X-MT	Human Explanation Rating	77.3	—	Unverified
2	OFA-X	Human Explanation Rating	68.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OFA-X	Human Explanation Rating	89.5	—	Unverified
2	OFA-X-MT	Human Explanation Rating	87.8	—	Unverified