SOTAVerified|Agents Browse Leaderboard About

Explanation Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 21–30 of 235 papers

Title	Date	Tasks	Status	Hype	Score
Do Vision & Language Decoders use Images and Text equally? How Self-consistent are their Explanations?	Apr 29, 2024	Answer GenerationBenchmarking	CodeCode Available	1	5
End-to-End Multimodal Fact-Checking and Explanation Generation: A Challenging Dataset and Models	May 25, 2022	ArticlesClaim Verification	CodeCode Available	1	5
Explainable Automated Fact-Checking for Public Health Claims	Oct 19, 2020	Explanation GenerationFact Checking	CodeCode Available	1	5
Explainable Legal Case Matching via Inverse Optimal Transport-based Rationale Extraction	Jul 9, 2022	Explanation GenerationFairness	CodeCode Available	1	5
LLMRec: Benchmarking Large Language Models on Recommendation Task	Aug 23, 2023	BenchmarkingExplanation Generation	CodeCode Available	1	5
Faithfully Explainable Recommendation via Neural Logic Reasoning	Apr 16, 2021	Decision MakingExplainable Recommendation	CodeCode Available	1	5
Explain and Predict, and then Predict Again	Jan 11, 2021	Explanation GenerationFact Verification	CodeCode Available	1	5
QED: A Framework and Dataset for Explanations in Question Answering	Sep 8, 2020	Explanation GenerationNatural Questions	CodeCode Available	1	5
LLM4Vis: Explainable Visualization Recommendation using ChatGPT	Oct 11, 2023	Data VisualizationExplanation Generation	CodeCode Available	1	5
Sim2Word: Explaining Similarity with Representative Attribute Words via Counterfactual Explanations	Sep 8, 2022	Attributecounterfactual	CodeCode Available	1	5

Show:10 25 50

← PrevPage 3 of 24Next →

All datasets WHOOPS!CLEVR-X e-SNLI-VE VCR VQA-X

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	VLIS (Lynx)	Accuracy	80	—	Unverified
2	VLIS (LLaVA)	Accuracy	73	—	Unverified
3	Ground-truth Caption -> GPT3 (Oracle)	Human (%)	68	—	Unverified
4	Predicted Caption -> GPT3	Human (%)	33	—	Unverified
5	BLIP2 FlanT5-XXL (Fine-tuned)	Human (%)	27	—	Unverified
6	BLIP2 FlanT5-XL (Fine-tuned)	Human (%)	15	—	Unverified
7	BLIP2 FlanT5-XXL (Zero-shot)	Human (%)	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PJ-X	B4	87.4	—	Unverified
2	FM	B4	78.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OFA-X	Human Explanation Rating	85.7	—	Unverified
2	OFA-X-MT	Human Explanation Rating	80.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OFA-X-MT	Human Explanation Rating	77.3	—	Unverified
2	OFA-X	Human Explanation Rating	68.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OFA-X	Human Explanation Rating	89.5	—	Unverified
2	OFA-X-MT	Human Explanation Rating	87.8	—	Unverified