SOTAVerified|Agents Browse Leaderboard About

Explanation Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 91–100 of 235 papers

Title	Date	Tasks	Status	Hype
Towards LLM-guided Causal Explainability for Black-box Text Classifiers	Sep 23, 2023	counterfactualCounterfactual Explanation	—Unverified	0
Exploring Iterative Enhancement for Improving Learnersourced Multiple-Choice Question Explanations with Large Language Models	Sep 19, 2023	Explanation GenerationLanguage Modelling	CodeCode Available	0
Fin-Fact: A Benchmark Dataset for Multimodal Financial Fact Checking and Explanation Generation	Sep 15, 2023	Explanation GenerationFact Checking	CodeCode Available	1
Reward Engineering for Generating Semi-structured Explanation	Sep 15, 2023	Explanation GenerationReinforcement Learning (RL)	CodeCode Available	0
HealthFC: Verifying Health Claims with Evidence-Based Medical Fact-Checking	Sep 15, 2023	Claim VerificationExplanation Generation	CodeCode Available	1
Dynamic MOdularized Reasoning for Compositional Structured Explanation Generation	Sep 14, 2023	Explanation Generation	—Unverified	0
A Survey on Interpretable Cross-modal Reasoning	Sep 5, 2023	Cross-Modal RetrievalDecision Making	CodeCode Available	1
Affective Visual Dialog: A Large-Scale Benchmark for Emotional Reasoning Based on Visually Grounded Conversations	Aug 30, 2023	Explanation GenerationQuestion Answering	—Unverified	0
RecMind: Large Language Model Powered Agent For Recommendation	Aug 28, 2023	Explanation GenerationLanguage Modeling	—Unverified	0
Explaining with Attribute-based and Relational Near Misses: An Interpretable Approach to Distinguishing Facial Expressions of Pain and Disgust	Aug 27, 2023	AttributeExplanation Generation	—Unverified	0

Show:10 25 50

← PrevPage 10 of 24Next →

All datasets WHOOPS!CLEVR-X e-SNLI-VE VCR VQA-X

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	VLIS (Lynx)	Accuracy	80	—	Unverified
2	VLIS (LLaVA)	Accuracy	73	—	Unverified
3	Ground-truth Caption -> GPT3 (Oracle)	Human (%)	68	—	Unverified
4	Predicted Caption -> GPT3	Human (%)	33	—	Unverified
5	BLIP2 FlanT5-XXL (Fine-tuned)	Human (%)	27	—	Unverified
6	BLIP2 FlanT5-XL (Fine-tuned)	Human (%)	15	—	Unverified
7	BLIP2 FlanT5-XXL (Zero-shot)	Human (%)	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PJ-X	B4	87.4	—	Unverified
2	FM	B4	78.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OFA-X	Human Explanation Rating	85.7	—	Unverified
2	OFA-X-MT	Human Explanation Rating	80.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OFA-X-MT	Human Explanation Rating	77.3	—	Unverified
2	OFA-X	Human Explanation Rating	68.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OFA-X	Human Explanation Rating	89.5	—	Unverified
2	OFA-X-MT	Human Explanation Rating	87.8	—	Unverified