Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9826–9850 of 10817 papers

Title	Date	Tasks	Status
Robust Question Answering against Distribution Shifts with Test-Time Adaptation: An Empirical Study	Feb 9, 2023	Imitation LearningQuestion Answering	CodeCode Available
Neural Arabic Question Answering	Jun 12, 2019	ArticlesInformation Retrieval	CodeCode Available
Learning Visual Question Answering by Bootstrapping Hard Attention	Aug 1, 2018	Hard AttentionQuestion Answering	CodeCode Available
Learning What is Essential in Questions	Aug 1, 2017	Information RetrievalQuestion Answering	CodeCode Available
Question-Instructed Visual Descriptions for Zero-Shot Video Question Answering	Feb 16, 2024	Language ModelingLanguage Modelling	CodeCode Available
Automated Text-to-Table for Reasoning-Intensive Table QA: Pipeline Design and Benchmarking Insights	May 26, 2025	BenchmarkingQuestion Answering	CodeCode Available
HumaniBench: A Human-Centric Framework for Large Multimodal Models Evaluation	May 16, 2025	BenchmarkingEthics	CodeCode Available
Temporally-Grounded Language Generation: A Benchmark for Real-Time Vision-Language Models	May 16, 2025	Image CaptioningQuestion Answering	CodeCode Available
Cognitive Visual Commonsense Reasoning Using Dynamic Working Memory	Jul 4, 2021	Question AnsweringScene Understanding	CodeCode Available
A Mutual Information Maximization Approach for the Spurious Solution Problem in Weakly Supervised Question Answering	Jun 14, 2021	Question Answering	CodeCode Available
Exploring the Readiness of Prominent Small Language Models for the Democratization of Financial Literacy	Oct 9, 2024	Few-Shot LearningQuestion Answering	CodeCode Available
A Deep Relevance Matching Model for Ad-hoc Retrieval	Nov 23, 2017	Ad-Hoc Information RetrievalParaphrase Identification	CodeCode Available
Exploring the Effect of Primitives for Compositional Generalization in Vision-and-Language	Jan 1, 2023	Question AnsweringSelf-Supervised Learning	CodeCode Available
Auto-hMDS: Automatic Construction of a Large Heterogeneous Multilingual Multi-Document Summarization Corpus	May 1, 2018	Abstractive Text SummarizationDocument Summarization	CodeCode Available
KnowledgePrompts: Exploring the Abilities of Large Language Models to Solve Proportional Analogies via Knowledge-Enhanced Prompting	Dec 1, 2024	Multiple-choiceMultiple Choice Question Answering (MCQA)	CodeCode Available
Neural Domain Adaptation for Biomedical Question Answering	Jun 12, 2017	ArticlesDomain Adaptation	CodeCode Available
Exploring Temporal Concurrency for Video-Language Representation Learning	Jan 1, 2023	Dynamic Time WarpingMetric Learning	CodeCode Available
Neural Duplicate Question Detection without Labeled Training Data	Nov 13, 2019	Answer SelectionCommunity Question Answering	CodeCode Available
AutoBench-V: Can Large Vision-Language Models Benchmark Themselves?	Oct 28, 2024	BenchmarkingQuestion Answering	CodeCode Available
LEGAL-UQA: A Low-Resource Urdu-English Dataset for Legal Question Answering	Oct 16, 2024	Optical Character Recognition (OCR)Question Answering	CodeCode Available
A Deep Architecture for Semantic Matching with Multiple Positional Sentence Representations	Nov 26, 2015	Information RetrievalQuestion Answering	CodeCode Available
Neural Generative Question Answering	Dec 4, 2015	DecoderGenerative Question Answering	CodeCode Available
Exploring Neural Language Models via Analysis of Local and Global Self-Attention Spaces	Apr 1, 2021	Machine TranslationQuestion Answering	CodeCode Available
Exploring Modulated Detection Transformer as a Tool for Action Recognition in Videos	Sep 21, 2022	Action DetectionAction Recognition	CodeCode Available
Length Optimization in Conformal Prediction	Jun 27, 2024	Conformal PredictionLanguage Modeling	CodeCode Available

Show:10 25 50

← PrevPage 394 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified