Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9901–9950 of 10817 papers

Title	Date	Tasks	Status
Temporally-Grounded Language Generation: A Benchmark for Real-Time Vision-Language Models	May 16, 2025	Image CaptioningQuestion Answering	CodeCode Available
Neural Semantic Parsing with Type Constraints for Semi-Structured Tables	Sep 1, 2017	DecoderEntity Linking	CodeCode Available
Neural Shuffle-Exchange Networks -- Sequence Processing in O(n log n) Time	Jul 18, 2019	LAMBADALanguage Modeling	CodeCode Available
Lexicalization Is All You Need: Examining the Impact of Lexical Knowledge in a Compositional QALD System	Nov 6, 2024	AllQuestion Answering	CodeCode Available
Neural Shuffle-Exchange Networks - Sequence Processing in O(n log n) Time	Dec 1, 2019	LAMBADALanguage Modeling	CodeCode Available
Neural Stored-program Memory	May 25, 2019	continual few-shot learningFew-Shot Learning	CodeCode Available
Pre-training Cross-lingual Open Domain Question Answering with Large-scale Synthetic Supervision	Feb 26, 2024	Answer GenerationCross-Lingual Question Answering	CodeCode Available
Addressing Issues of Cross-Linguality in Open-Retrieval Question Answering Systems For Emergent Domains	Jan 26, 2022	ArticlesQuestion Answering	CodeCode Available
EXAQ: Exponent Aware Quantization For LLMs Acceleration	Oct 4, 2024	QuantizationQuestion Answering	CodeCode Available
Scaling Reasoning can Improve Factuality in Large Language Models	May 16, 2025	Knowledge GraphsLarge Language Model	CodeCode Available
LGAR: Zero-Shot LLM-Guided Neural Ranking for Abstract Screening in Systematic Literature Reviews	May 30, 2025	Binary ClassificationQuestion Answering	CodeCode Available
Neural-Symbolic VQA: Disentangling Reasoning from Vision and Language Understanding	Oct 4, 2018	Question AnsweringRepresentation Learning	CodeCode Available
ExAnte: A Benchmark for Ex-Ante Inference in Large Language Models	May 26, 2025	PredictionQuestion Answering	CodeCode Available
QUITE: Quantifying Uncertainty in Natural Language Text in Bayesian Reasoning Scenarios	Oct 14, 2024	Question Answering	CodeCode Available
Co-attending Regions and Detections with Multi-modal Multiplicative Embedding for VQA	Nov 18, 2017	FormQuestion Answering	CodeCode Available
Examining Gender and Racial Bias in Large Vision-Language Models Using a Novel Dataset of Parallel Images	Feb 8, 2024	Image CaptioningQuestion Answering	CodeCode Available
Evidence Sentence Extraction for Machine Reading Comprehension	Feb 23, 2019	Machine Reading ComprehensionMultiple-choice	CodeCode Available
Neural Variational Inference for Text Processing	Nov 19, 2015	Answer SelectionQuestion Answering	CodeCode Available
DiffQue: Estimating Relative Difficulty of Questions in Community Question Answering Services	Jun 1, 2019	Community Question AnsweringQuestion Answering	CodeCode Available
Quizbowl: The Case for Incremental Question Answering	Apr 9, 2019	BIG-bench Machine LearningDecision Making	CodeCode Available
Neurocache: Efficient Vector Retrieval for Long-range Language Modeling	Jul 2, 2024	Few-Shot LearningLanguage Modeling	CodeCode Available
Pre-Training Multi-Modal Dense Retrievers for Outside-Knowledge Visual Question Answering	Jun 28, 2023	Passage RetrievalQuestion Answering	CodeCode Available
QPaug: Question and Passage Augmentation for Open-Domain Question Answering of LLMs	Jun 20, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
Audiopedia: Audio QA with Knowledge	Dec 29, 2024	Audio Question AnsweringEntity Linking	CodeCode Available
Lightweight Recurrent Cross-modal Encoder for Video Question Answering	Jun 30, 2023	Action RecognitionQuestion Answering	CodeCode Available
Likelihood as a Performance Gauge for Retrieval-Augmented Generation	Nov 12, 2024	Language ModelingLanguage Modelling	CodeCode Available
Evidence-Focused Fact Summarization for Knowledge-Augmented Zero-Shot Question Answering	Mar 5, 2024	FormKnowledge Graphs	CodeCode Available
Evidence Aggregation for Answer Re-Ranking in Open-Domain Question Answering	Nov 14, 2017	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
Limited Ability of LLMs to Simulate Human Psychological Behaviours: a Psychometric Analysis	May 12, 2024	Multiple-choiceQuestion Answering	CodeCode Available
Active Learning to Guide Labeling Efforts for Question Difficulty Estimation	Sep 14, 2024	Active LearningQuestion Answering	CodeCode Available
Neuro-Symbolic Visual Dialog	Aug 22, 2022	Question Answering	CodeCode Available
Event Knowledge Incorporation with Posterior Regularization for Event-Centric Question Answering	May 8, 2023	Language ModellingQuestion Answering	CodeCode Available
Relation-Aware Graph Attention Network for Visual Question Answering	Mar 29, 2019	Graph AttentionImplicit Relations	CodeCode Available
Event Detection as Question Answering with Entity Information	Apr 14, 2021	Event DetectionLanguage Modeling	CodeCode Available
Pretraining Vision-Language Model for Difference Visual Question Answering in Longitudinal Chest X-rays	Feb 14, 2024	Language ModelingLanguage Modelling	CodeCode Available
Relation-aware Hierarchical Attention Framework for Video Question Answering	May 13, 2021	Question AnsweringRelation	CodeCode Available
A Qualitative Comparison of CoQA, SQuAD 2.0 and QuAC	Sep 27, 2018	Question Answering	CodeCode Available
CNN for Text-Based Multiple Choice Question Answering	Jul 1, 2018	Multiple-choiceQuestion Answering	CodeCode Available
CNM: An Interpretable Complex-valued Network for Matching	Apr 10, 2019	BenchmarkingQuestion Answering	CodeCode Available
Primacy Effect of ChatGPT	Oct 20, 2023	Natural Language UnderstandingQuestion Answering	CodeCode Available
Attribute Diversity Determines the Systematicity Gap in VQA	Nov 15, 2023	AttributeDiagnostic	CodeCode Available
CODAH: An Adversarially Authored Question-Answer Dataset for Common Sense	Apr 8, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available
Event-Centric Question Answering via Contrastive Learning and Invertible Event Transformation	Oct 24, 2022	Contrastive LearningQuestion Answering	CodeCode Available
Attributed and Predictive Entity Embedding for Fine-Grained Entity Typing in Knowledge Bases	Aug 1, 2018	Entity LinkingEntity Typing	CodeCode Available
AttenWalker: Unsupervised Long-Document Question Answering via Attention-based Graph Walking	May 3, 2023	Few-Shot LearningQuestion Answering	CodeCode Available
Evaluation of Semantic Answer Similarity Metrics	Jun 25, 2022	Machine TranslationQuestion Answering	CodeCode Available
LININ: Logic Integrated Neural Inference Network for Explanatory Visual Question Answering	Dec 24, 2024	Explanatory Visual Question AnsweringMultimodal Reasoning	CodeCode Available
AQA: Adaptive Question Answering in a Society of LLMs via Contextual Multi-Armed Bandit	Sep 20, 2024	Question Answering	CodeCode Available
Evaluating the Elementary Multilingual Capabilities of Large Language Models with MultiQ	Mar 6, 2024	Open-Ended Question AnsweringQuestion Answering	CodeCode Available
NewsQuote: A Dataset Built on Quote Extraction and Attribution for Expert Recommendation in Fact-Checking	May 5, 2023	ArticlesFact Checking	CodeCode Available

Show:10 25 50

← PrevPage 199 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified