Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10651–10675 of 10817 papers

Title	Date	Tasks	Status
Think Visually: Question Answering through Virtual Imagery	May 25, 2018	Question AnsweringVisual Commonsense Reasoning	CodeCode Available
Symbolic Priors for RNN-based Semantic Parsing	Sep 20, 2018	Question AnsweringSemantic Parsing	CodeCode Available
SyllabusQA: A Course Logistics Question Answering Dataset	Mar 3, 2024	Language ModelingLanguage Modelling	CodeCode Available
Unifying Text, Tables, and Images for Multimodal Question Answering	Dec 10, 2023	Image CaptioningQuestion Answering	CodeCode Available
Think Twice: Measuring the Efficiency of Eliminating Prediction Shortcuts of Question Answering Models	May 11, 2023	Question Answering	CodeCode Available
SwissAlps at SemEval-2017 Task 3: Attention-based Convolutional Neural Network for Community Question Answering	Aug 1, 2017	Community Question AnsweringQuestion Answering	CodeCode Available
Think before You Simulate: Symbolic Reasoning to Orchestrate Neural Computation for Counterfactual Question Answering	Jun 12, 2025	counterfactualCounterfactual Reasoning	CodeCode Available
X-GGM: Graph Generative Modeling for Out-of-Distribution Generalization in Visual Question Answering	Jul 24, 2021	AttributeOut-of-Distribution Generalization	CodeCode Available
Thieves on Sesame Street! Model Extraction of BERT-based APIs	Oct 27, 2019	Language ModelingLanguage Modelling	CodeCode Available
SWI: Speaking with Intent in Large Language Models	Mar 27, 2025	Mathematical ReasoningQuestion Answering	CodeCode Available
UNIMELB at SemEval-2016 Tasks 4A and 4B: An Ensemble of Neural Networks and a Word2Vec Based Model for Sentiment Classification	Jun 1, 2016	Document ClassificationLanguage Modeling	CodeCode Available
Simple Applications of BERT for Ad Hoc Document Retrieval	Mar 26, 2019	Ad-Hoc Information RetrievalQuestion Answering	CodeCode Available
SURE-VQA: Systematic Understanding of Robustness Evaluation in Medical VQA Tasks	Nov 29, 2024	Question AnsweringVisual Question Answering	CodeCode Available
Simple and Effective Text Matching with Richer Alignment Features	Aug 1, 2019	Answer SelectionNatural Language Inference	CodeCode Available
They Exist! Introducing Plural Mentions to Coreference Resolution and Entity Linking	Aug 1, 2018	coreference-resolutionCoreference Resolution	CodeCode Available
Supervised Knowledge Makes Large Language Models Better In-context Learners	Dec 26, 2023	In-Context LearningNatural Language Understanding	CodeCode Available
Self Question-answering: Aspect-based Sentiment Analysis by Role Flipped Machine Reading Comprehension	Nov 1, 2021	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available
UniPSDA: Unsupervised Pseudo Semantic Data Augmentation for Zero-Shot Cross-Lingual Natural Language Understanding	Jun 24, 2024	Data AugmentationNatural Language Understanding	CodeCode Available
The TechQA Dataset	Nov 8, 2019	Domain AdaptationQuestion Answering	CodeCode Available
The Shmoop Corpus: A Dataset of Stories with Loosely Aligned Summaries	Dec 30, 2019	Abstractive Text SummarizationForm	CodeCode Available
The Role of Output Vocabulary in T2T LMs for SPARQL Semantic Parsing	May 24, 2023	Graph Question AnsweringQuestion Answering	CodeCode Available
The representation landscape of few-shot learning and fine-tuning in large language models	Sep 5, 2024	Few-Shot LearningIn-Context Learning	CodeCode Available
UniRS: Unifying Multi-temporal Remote Sensing Tasks through Vision Language Models	Dec 30, 2024	Question AnsweringScene Classification	CodeCode Available
SemEval-2019 Task 10: Math Question Answering	Jun 1, 2019	MathQuestion Answering	CodeCode Available
WebQAmGaze: A Multilingual Webcam Eye-Tracking-While-Reading Dataset	Mar 31, 2023	Question Answering	CodeCode Available

Show:10 25 50

← PrevPage 427 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified