Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2251–2300 of 10817 papers

Title	Date	Tasks	Status
Co-attentional Transformers for Story-Based Video Understanding	Oct 27, 2020	Question AnsweringVideo Question Answering	—Unverified
All-in-one: Understanding and Generation in Multimodal Reasoning with the MAIA Benchmark	Feb 24, 2025	AllMultimodal Reasoning	—Unverified
Asking questions on handwritten document collections	Oct 2, 2021	Optical Character Recognition (OCR)Question Answering	—Unverified
Adaptive Memory Networks	Feb 1, 2018	Decision MakingQuestion Answering	—Unverified
Coarse-to-Fine Question Answering for Long Documents	Jul 1, 2017	Question AnsweringReading Comprehension	—Unverified
Coarse-to-Fine Query Focused Multi-Document Summarization	Nov 1, 2020	Document SummarizationMulti-Document Summarization	—Unverified
Coarse-to-Fine Highlighting: Reducing Knowledge Hallucination in Large Language Models	Oct 19, 2024	HallucinationLanguage Modeling	—Unverified
Coarse to Fine Grained Sense Disambiguation in Wikipedia	Jun 1, 2013	Coreference ResolutionInformation Retrieval	—Unverified
Asking More Informative Questions for Grounded Retrieval	Nov 14, 2023	Question AnsweringQuestion Selection	—Unverified
Differential Information: An Information-Theoretic Perspective on Preference Optimization	May 29, 2025	Inductive BiasInstruction Following	—Unverified
Dimensions of Interpersonal Relationships: Corpus and Experiments	Sep 1, 2017	Question Answering	—Unverified
Coarse-to-Fine Attention Models for Document Summarization	Sep 1, 2017	Document SummarizationMachine Translation	—Unverified
Coarse-to-Careful: Seeking Semantic-related Knowledge for Open-domain Commonsense Question Answering	Jul 4, 2021	Question Answering	—Unverified
Coarse Lexical Frame Acquisition at the Syntax--Semantics Interface Using a Latent-Variable PCFG Model	Jun 1, 2018	ClusteringQuestion Answering	—Unverified
Coarse-grain Fine-grain Coattention Network for Multi-evidence Question Answering	Jan 3, 2019	Question Answering	—Unverified
Asking Clarification Questions in Knowledge-Based Question Answering	Nov 1, 2019	Question AnsweringQuestion Generation	—Unverified
Coarse-grained decomposition and fine-grained interaction for multi-hop question answering	Jan 15, 2021	Multi-hop Question AnsweringQuestion Answering	—Unverified
Coal Mining Question Answering with LLMs	Oct 3, 2024	Prompt EngineeringQuestion Answering	—Unverified
Ask & Explore: Grounded Question Answering for Curiosity-Driven Exploration	Apr 24, 2021	Question Answering	—Unverified
Abstract Meaning Representation of Constructions: The More We Include, the Better the Representation	May 1, 2018	Abstract Meaning RepresentationMachine Translation	—Unverified
Different Contexts Lead to Different Word Embeddings	Dec 1, 2016	ClusteringInformation Retrieval	—Unverified
Differentiable End-to-End Program Executor for Sample and Computationally Efficient VQA	Jan 1, 2021	Question AnsweringVisual Question Answering	—Unverified
CNGL: Grading Student Answers by Acts of Translation	Jun 1, 2013	Machine TranslationQuestion Answering	—Unverified
CMU LiveMedQA at TREC 2017 LiveQA: A Consumer Health Question Answering System	Nov 15, 2017	Answer GenerationGeneral Classification	—Unverified
Ask-EDA: A Design Assistant Empowered by LLM, Hybrid RAG and Abbreviation De-hallucination	Jun 3, 2024	HallucinationQuestion Answering	—Unverified
CMU: Arc-Factored, Discriminative Semantic Dependency Parsing	Aug 1, 2014	ARCDependency Parsing	—Unverified
A Linguistic Study on Relevance Modeling in Information Retrieval	Mar 1, 2021	Information RetrievalNatural Language Understanding	—Unverified
DIEM: Decomposition-Integration Enhancing Multimodal Insights	Jan 1, 2024	MM-VetQuestion Answering	—Unverified
DIESEL -- Dynamic Inference-Guidance via Evasion of Semantic Embeddings in LLMs	Nov 28, 2024	Question AnsweringReranking	—Unverified
A Simple Yet Strong Pipeline for HotpotQA	Apr 14, 2020	Multi-hop Question Answeringnamed-entity-recognition	—Unverified
C-MORE: Pretraining to Answer Open-Domain Questions by Consulting Millions of References	Oct 16, 2021	Open-Domain Question AnsweringQuestion Answering	—Unverified
DictaBERT: A State-of-the-Art BERT Suite for Modern Hebrew	Aug 31, 2023	Morphological TaggingQuestion Answering	—Unverified
Clustering of Multi-Word Named Entity variants: Multilingual Evaluation	May 1, 2014	ClusteringDocument Classification	—Unverified
DIF: A Framework for Benchmarking and Verifying Implicit Bias in LLMs	May 15, 2025	BenchmarkingFairness	—Unverified
Differentiable Retrieval Augmentation via Generative Language Modeling for E-commerce Query Intent Classification	Aug 18, 2023	intent-classificationIntent Classification	—Unverified
DiN: Diffusion Model for Robust Medical VQA with Semantic Noisy Labels	Mar 24, 2025	Medical Visual Question AnsweringQuestion Answering	—Unverified
Clustering Monolingual Vocabularies to Improve Cross-Lingual Generalization	Nov 1, 2021	ClusteringQuestion Answering	—Unverified
Clustering Examples in Multi-Dataset Benchmarks with Item Response Theory	May 1, 2022	ClusteringNatural Language Inference	—Unverified
AliMe MKG: A Multi-modal Knowledge Graph for Live-streaming E-commerce	Sep 13, 2021	Multi-modal Knowledge GraphQuestion Answering	—Unverified
Cluster-Former: Clustering-based Sparse Transformer for Question Answering	Jan 1, 2021	ClusteringQuestion Answering	—Unverified
Cluster-Former: Clustering-based Sparse Transformer for Long-Range Dependency Encoding	Sep 13, 2020	ClusteringLanguage Modelling	—Unverified
Agentic Medical Knowledge Graphs Enhance Medical Question Answering: Bridging the Gap Between LLMs and Evolving Medical Knowledge	Feb 18, 2025	Graph GenerationKnowledge Graphs	—Unverified
A Simple Linear Patch Revives Layer-Pruned Large Language Models	May 30, 2025	Knowledge DistillationQuestion Answering	—Unverified
A Simple End-to-End Question Answering Model for Product Information	Jul 1, 2018	Answer SelectionQuestion Answering	—Unverified
CLTR: An End-to-End, Transformer-Based System for Cell-Level Table Retrieval and Table Question Answering	Aug 1, 2021	Question AnsweringRetrieval	—Unverified
AliMe KG: Domain Knowledge Graph Construction and Application in E-commerce	Sep 24, 2020	graph constructionQuestion Answering	—Unverified
Dialog state tracking, a machine reading approach using Memory Network	Jun 13, 2016	dialog state trackingManagement	—Unverified
Dialogue Act Recognition for Text-based Sinhala	Dec 1, 2015	Meeting SummarizationQuestion Answering	—Unverified
A Simple but Effective Method to Incorporate Multi-turn Context with BERT for Conversational Machine Comprehension	May 30, 2019	Language ModelingLanguage Modelling	—Unverified
CL-ReKD: Cross-lingual Knowledge Distillation for Multilingual Retrieval Question Answering	Jan 16, 2022	Knowledge DistillationLanguage Modeling	—Unverified

Show:10 25 50

← PrevPage 46 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified