Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9901–9925 of 10817 papers

Title	Date	Tasks	Status
Neural Shuffle-Exchange Networks - Sequence Processing in O(n log n) Time	Dec 1, 2019	LAMBADALanguage Modeling	CodeCode Available
Lexicalization Is All You Need: Examining the Impact of Lexical Knowledge in a Compositional QALD System	Nov 6, 2024	AllQuestion Answering	CodeCode Available
Neural Stored-program Memory	May 25, 2019	continual few-shot learningFew-Shot Learning	CodeCode Available
Scaling Reasoning can Improve Factuality in Large Language Models	May 16, 2025	Knowledge GraphsLarge Language Model	CodeCode Available
QUITE: Quantifying Uncertainty in Natural Language Text in Bayesian Reasoning Scenarios	Oct 14, 2024	Question Answering	CodeCode Available
Addressing Issues of Cross-Linguality in Open-Retrieval Question Answering Systems For Emergent Domains	Jan 26, 2022	ArticlesQuestion Answering	CodeCode Available
Expanding End-to-End Question Answering on Differentiable Knowledge Graphs with Intersection	Sep 13, 2021	Knowledge GraphsQuestion Answering	CodeCode Available
Neural-Symbolic VQA: Disentangling Reasoning from Vision and Language Understanding	Oct 4, 2018	Question AnsweringRepresentation Learning	CodeCode Available
LGAR: Zero-Shot LLM-Guided Neural Ranking for Abstract Screening in Systematic Literature Reviews	May 30, 2025	Binary ClassificationQuestion Answering	CodeCode Available
Quizbowl: The Case for Incremental Question Answering	Apr 9, 2019	BIG-bench Machine LearningDecision Making	CodeCode Available
EXAQ: Exponent Aware Quantization For LLMs Acceleration	Oct 4, 2024	QuantizationQuestion Answering	CodeCode Available
CODAH: An Adversarially-Authored Question Answering Dataset for Common Sense	Jun 1, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available
Neural Variational Inference for Text Processing	Nov 19, 2015	Answer SelectionQuestion Answering	CodeCode Available
ExAnte: A Benchmark for Ex-Ante Inference in Large Language Models	May 26, 2025	PredictionQuestion Answering	CodeCode Available
Examining Gender and Racial Bias in Large Vision-Language Models Using a Novel Dataset of Parallel Images	Feb 8, 2024	Image CaptioningQuestion Answering	CodeCode Available
Relation-Aware Graph Attention Network for Visual Question Answering	Mar 29, 2019	Graph AttentionImplicit Relations	CodeCode Available
Pre-Training Multi-Modal Dense Retrievers for Outside-Knowledge Visual Question Answering	Jun 28, 2023	Passage RetrievalQuestion Answering	CodeCode Available
Neurocache: Efficient Vector Retrieval for Long-range Language Modeling	Jul 2, 2024	Few-Shot LearningLanguage Modeling	CodeCode Available
Augmenting Visual Question Answering with Semantic Frame Information in a Multitask Learning Approach	Jan 31, 2020	Question AnsweringVisual Question Answering	CodeCode Available
QPaug: Question and Passage Augmentation for Open-Domain Question Answering of LLMs	Jun 20, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
Relation-aware Hierarchical Attention Framework for Video Question Answering	May 13, 2021	Question AnsweringRelation	CodeCode Available
A Multi-Type Multi-Span Network for Reading Comprehension that Requires Discrete Reasoning	Aug 15, 2019	NegationQuestion Answering	CodeCode Available
Lightweight Recurrent Cross-modal Encoder for Video Question Answering	Jun 30, 2023	Action RecognitionQuestion Answering	CodeCode Available
Likelihood as a Performance Gauge for Retrieval-Augmented Generation	Nov 12, 2024	Language ModelingLanguage Modelling	CodeCode Available
Evidence Sentence Extraction for Machine Reading Comprehension	Feb 23, 2019	Machine Reading ComprehensionMultiple-choice	CodeCode Available

Show:10 25 50

← PrevPage 397 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified