Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9526–9550 of 10817 papers

Title	Date	Tasks	Status
Context-aware Frame-Semantic Role Labeling	Jan 1, 2015	Question AnsweringScene Generation	CodeCode Available
Language Fusion for Parameter-Efficient Cross-lingual Transfer	Jan 12, 2025	Cross-Lingual TransferNatural Language Inference	CodeCode Available
Adapting Visual Question Answering Models for Enhancing Multimodal Community Q&A Platforms	Aug 29, 2018	Community Question AnsweringGeneral Classification	CodeCode Available
Multimodal Large Language Models and Tunings: Vision, Language, Sensors, Audio, and Beyond	Oct 8, 2024	Question AnsweringVisual Question Answering	CodeCode Available
Recursive Visual Attention in Visual Dialog	Dec 6, 2018	Question AnsweringVisual Dialog	CodeCode Available
From Roots to Rewards: Dynamic Tree Reasoning with RL	Jul 17, 2025	Computational EfficiencyQuestion Answering	CodeCode Available
Analyzing Vietnamese Legal Questions Using Deep Neural Networks with Biaffine Classifiers	Apr 27, 2023	Dependency ParsingPOS	CodeCode Available
PEYMA: A Tagged Corpus for Persian Named Entities	Jan 30, 2018	NERQuestion Answering	CodeCode Available
E-BERT: Efficient-Yet-Effective Entity Embeddings for BERT	Nov 9, 2019	Entity EmbeddingsEntity Linking	CodeCode Available
Robust and Scalable Differentiable Neural Computer for Question Answering	Jul 7, 2018	Question Answering	CodeCode Available
Language Model Knowledge Distillation for Efficient Question Answering in Spanish	Dec 7, 2023	Knowledge DistillationLanguage Modeling	CodeCode Available
Abductive Commonsense Reasoning	Aug 15, 2019	Multiple-choiceNatural Language Inference	CodeCode Available
Language models are better than humans at next-token prediction	Dec 21, 2022	Question Answering	CodeCode Available
SemEval-2019 Task 8: Fact Checking in Community Question Answering Forums	May 25, 2019	Community Question AnsweringFact Checking	CodeCode Available
From Philosophy to Interfaces: an Explanatory Method and a Tool Inspired by Achinstein's Theory of Explanation	Sep 9, 2021	Explainable Artificial Intelligence (XAI)Knowledge Graphs	CodeCode Available
From Models to Microtheories: Distilling a Model's Topical Knowledge for Grounded Question Answering	Dec 23, 2024	Question Answering	CodeCode Available
From Images to Textual Prompts: Zero-shot VQA with Frozen Large Language Models	Dec 21, 2022	Question AnsweringVisual Question Answering	CodeCode Available
Constraint-Based Question Answering with Knowledge Graph	Dec 1, 2016	Question Answering	CodeCode Available
Multimodal Preference Data Synthetic Alignment with Reward Model	Dec 23, 2024	2kCaption Generation	CodeCode Available
Language Models as Knowledge Bases?	Sep 3, 2019	Language ModellingOpen-Domain Question Answering	CodeCode Available
Language Models as Knowledge Bases for Visual Word Sense Disambiguation	Oct 3, 2023	Image CaptioningMultiple-choice	CodeCode Available
From Feature Importance to Natural Language Explanations Using LLMs with RAG	Jul 30, 2024	counterfactualCounterfactual Reasoning	CodeCode Available
Consistency Training by Synthetic Question Generation for Conversational Question Answering	Apr 17, 2024	Conversational Question AnsweringData Augmentation	CodeCode Available
Language Models Can See Better: Visual Contrastive Decoding For LLM Multimodal Reasoning	Feb 17, 2025	In-Context LearningMultimodal Reasoning	CodeCode Available
From Cloze to Comprehension: Retrofitting Pre-trained Masked Language Model to Pre-trained Machine Reader	Dec 9, 2022	ClassificationExtractive Question-Answering	CodeCode Available

Show:10 25 50

← PrevPage 382 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified