Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2026–2050 of 10817 papers

Title	Date	Tasks	Status	Hype	Score
Context Awareness Gate For Retrieval Augmented Generation	Nov 25, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1	5
AllenAct: A Framework for Embodied AI Research	Aug 28, 2020	Deep Reinforcement LearningEmbodied Question Answering	CodeCode Available	1	5
CodeQueries: A Dataset of Semantic Queries over Code	Sep 17, 2022	AttributeExtractive Question-Answering	CodeCode Available	1	5
Asking Clarification Questions to Handle Ambiguity in Open-Domain QA	May 23, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1	5
Learning to Ask Like a Physician	Jun 6, 2022	Question AnsweringQuestion Generation	CodeCode Available	1	5
ConditionalQA: A Complex Reading Comprehension Dataset with Conditional Answers	Oct 13, 2021	Logical ReasoningQuestion Answering	CodeCode Available	1	5
A Dataset and Baselines for Visual Question Answering on Art	Aug 28, 2020	Question AnsweringQuestion Generation	CodeCode Available	1	5
Asking Effective and Diverse Questions: A Machine Reading Comprehension based Framework for Joint Entity-Relation Extraction	Jul 1, 2020	DiversityMachine Reading Comprehension	CodeCode Available	1	5
Learning to Discretely Compose Reasoning Module Networks for Video Captioning	Jul 17, 2020	DecoderQuestion Answering	CodeCode Available	1	5
Conformal Alignment: Knowing When to Trust Foundation Models with Guarantees	May 16, 2024	Decision MakingInformativeness	CodeCode Available	1	5
Coarse-to-Fine Vision-Language Pre-training with Fusion in the Backbone	Jun 15, 2022	Described Object DetectionImage Captioning	CodeCode Available	1	5
Asking Questions the Human Way: Scalable Question-Answer Generation from Text Corpus	Jan 27, 2020	Answer GenerationChatbot	CodeCode Available	1	5
TurkishMMLU: Measuring Massive Multitask Language Understanding in Turkish	Jul 17, 2024	MathMultiple-choice	CodeCode Available	1	5
CAT-ViL: Co-Attention Gated Vision-Language Embedding for Visual Question Localized-Answering in Robotic Surgery	Jul 11, 2023	Question AnsweringScene Understanding	CodeCode Available	1	5
COBRA: Contrastive Bi-Modal Representation Algorithm	May 7, 2020	Cross-Modal RetrievalImage Captioning	CodeCode Available	1	5
Learning to Perturb Word Embeddings for Out-of-distribution QA	May 6, 2021	Data AugmentationDomain Generalization	CodeCode Available	1	5
TyDi QA: A Benchmark for Information-Seeking Question Answering in Typologically Diverse Languages	Mar 10, 2020	Question AnsweringTranslation	CodeCode Available	1	5
LLaSA: A Multimodal LLM for Human Activity Analysis Through Wearable and Smartphone Sensors	Jun 20, 2024	16kInstruction Following	CodeCode Available	1	5
Learning to Poison Large Language Models for Downstream Manipulation	Feb 21, 2024	Data PoisoningIn-Context Learning	CodeCode Available	1	5
UDA: A Benchmark Suite for Retrieval Augmented Generation in Real-world Document Analysis	Jun 21, 2024	Question AnsweringRAG	CodeCode Available	1	5
CodeQA: A Question Answering Dataset for Source Code Comprehension	Sep 17, 2021	Machine Reading ComprehensionQuestion Answering	CodeCode Available	1	5
LLaVA-SpaceSGG: Visual Instruct Tuning for Open-vocabulary Scene Graph Generation with Enhanced Spatial Relations	Dec 9, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
LogEval: A Comprehensive Benchmark Suite for Large Language Models In Log Analysis	Jul 2, 2024	Anomaly DetectionFault Diagnosis	CodeCode Available	1	5
ComQA:Compositional Question Answering via Hierarchical Graph Neural Networks	Jan 16, 2021	Answer SelectionMachine Reading Comprehension	CodeCode Available	1	5
LIQUID: A Framework for List Question Answering Dataset Generation	Feb 3, 2023	Dataset GenerationQuestion Answering	CodeCode Available	1	5

Show:10 25 50

← PrevPage 82 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified