SOTAVerified|Agents Browse Leaderboard About Blog

Explanation Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 41–50 of 235 papers

Title	Date	Tasks	Status	Hype
Breaking Common Sense: WHOOPS! A Vision-and-Language Benchmark of Synthetic and Compositional Images	Mar 13, 2023	Common Sense ReasoningExplanation Generation	—Unverified	0
Are Training Resources Insufficient? Predict First Then Explain!	Aug 29, 2021	Decision MakingExplanation Generation	—Unverified	0
Boosting Knowledge Graph-based Recommendations through Confidence-Aware Augmentation with Large Language Models	Feb 6, 2025	Contrastive LearningExplanation Generation	—Unverified	0
Active entailment encoding for explanation tree construction using parsimonious generation of hard negatives	Aug 2, 2022	Explanation GenerationQuestion Answering	—Unverified	0
E-KAR: A Benchmark for Rationalizing Natural Language Analogical Reasoning	Mar 16, 2022	Explanation GenerationQuestion Answering	—Unverified	0
Efficiently Explaining CSPs with Unsatisfiable Subset Optimization (extended algorithms and examples)	Mar 21, 2023	Explanation Generation	—Unverified	0
Best of Both Worlds: A Hybrid Approach for Multi-Hop Explanation with Declarative Facts	Dec 17, 2021	Explanation GenerationRetrieval	—Unverified	0
EGCR: Explanation Generation for Conversational Recommendation	Aug 17, 2022	Conversational RecommendationExplanation Generation	—Unverified	0
Do Natural Language Explanations Represent Valid Logical Arguments? Verifying Entailment in Explainable NLI Gold Standards	May 5, 2021	Explanation Generationvalid	—Unverified	0
Balancing Explicability and Explanation in Human-Aware Planning	Aug 1, 2017	Decision MakingExplanation Generation	—Unverified	0

Show:10 25 50

← PrevPage 5 of 24Next →

All datasets WHOOPS!CLEVR-X e-SNLI-VE VCR VQA-X

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	VLIS (Lynx)	Accuracy	80	—	Unverified
2	VLIS (LLaVA)	Accuracy	73	—	Unverified
3	Ground-truth Caption -> GPT3 (Oracle)	Human (%)	68	—	Unverified
4	Predicted Caption -> GPT3	Human (%)	33	—	Unverified
5	BLIP2 FlanT5-XXL (Fine-tuned)	Human (%)	27	—	Unverified
6	BLIP2 FlanT5-XL (Fine-tuned)	Human (%)	15	—	Unverified
7	BLIP2 FlanT5-XXL (Zero-shot)	Human (%)	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PJ-X	B4	87.4	—	Unverified
2	FM	B4	78.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OFA-X	Human Explanation Rating	85.7	—	Unverified
2	OFA-X-MT	Human Explanation Rating	80.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OFA-X-MT	Human Explanation Rating	77.3	—	Unverified
2	OFA-X	Human Explanation Rating	68.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OFA-X	Human Explanation Rating	89.5	—	Unverified
2	OFA-X-MT	Human Explanation Rating	87.8	—	Unverified