Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9551–9575 of 10817 papers

Title	Date	Tasks	Status
Consistency of Compositional Generalization across Multiple Levels	Dec 18, 2024	Meta-LearningQuestion Answering	CodeCode Available
Language Models Still Struggle to Zero-shot Reason about Time Series	Apr 17, 2024	Language ModelingLanguage Modelling	CodeCode Available
FriendsQA: A New Large-Scale Deep Video Understanding Dataset with Fine-grained Topic Categorization for Story Videos	Dec 22, 2024	Language ModellingLarge Language Model	CodeCode Available
Adversarial Examples for Evaluating Reading Comprehension Systems	Jul 23, 2017	Question AnsweringReading Comprehension	CodeCode Available
ConEntail: An Entailment-based Framework for Universal Zero and Few Shot Classification with Supervised Contrastive Pretraining	Oct 14, 2022	ClassificationNatural Language Inference	CodeCode Available
FrenchMedMCQA: A French Multiple-Choice Question Answering Dataset for Medical domain	Apr 9, 2023	Multiple-choiceMultiple Choice Question Answering (MCQA)	CodeCode Available
FreebaseQA: A New Factoid QA Data Set Matching Trivia-Style Question-Answer Pairs with Freebase	Jun 1, 2019	Question Answeringset matching	CodeCode Available
FREB-TQA: A Fine-Grained Robustness Evaluation Benchmark for Table Question Answering	Apr 29, 2024	Question Answering	CodeCode Available
FRAMES-VQA: Benchmarking Fine-Tuning Robustness across Multi-Modal Shifts in Visual Question Answering	May 27, 2025	BenchmarkingQuestion Answering	CodeCode Available
ReDiT: Re‑evaluating large visual question answering model confidence by defining input scenario Difficulty and applying Temperature mapping	Jan 6, 2025	Question AnsweringVisual Question Answering	CodeCode Available
Phrase-Indexed Question Answering: A New Challenge for Scalable Document Comprehension	Apr 20, 2018	Question AnsweringReading Comprehension	CodeCode Available
Phrase Retrieval for Open-Domain Conversational Question Answering with Conversational Dependency Modeling via Contrastive Learning	Jun 7, 2023	Contrastive LearningConversational Question Answering	CodeCode Available
Multimodal Residual Learning for Visual QA	Jun 5, 2016	Multiple-choiceQuestion Answering	CodeCode Available
BERTHop: An Effective Vision-and-Language Model for Chest X-ray Disease Diagnosis	Aug 10, 2021	Language ModelingLanguage Modelling	CodeCode Available
Question Answering over Linked Data with GPT-3	Aug 15, 2023	Knowledge Base Question AnsweringQuestion Answering	CodeCode Available
Large Language Models and Multimodal Retrieval for Visual Word Sense Disambiguation	Oct 21, 2023	Answer GenerationImage Retrieval	CodeCode Available
Frame- and Entity-Based Knowledge for Common-Sense Argumentative Reasoning	Nov 1, 2018	Argument MiningCommon Sense Reasoning	CodeCode Available
BERT Based Multilingual Machine Comprehension in English and Hindi	Jun 2, 2020	Multilingual Machine Comprehension in English HindiQuestion Answering	CodeCode Available
Conditioning LSTM Decoder and Bi-directional Attention Based Question Answering System	May 2, 2019	DecoderQuestion Answering	CodeCode Available
ForPKG: A Framework for Constructing Forestry Policy Knowledge Graph and Application Analysis	Nov 17, 2024	graph constructionKnowledge Graphs	CodeCode Available
FormulaReasoning: A Dataset for Formula-Based Numerical Reasoning	Feb 20, 2024	Data AugmentationHigh School Physics	CodeCode Available
Concise Answers to Complex Questions: Summarization of Long-form Answers	May 30, 2023	Extractive SummarizationForm	CodeCode Available
Large Language Models as Interpolated and Extrapolated Event Predictors	Jun 15, 2024	Knowledge GraphsQuestion Answering	CodeCode Available
Foreseeing the Benefits of Incidental Supervision	Jun 9, 2020	InformativenessLearning Theory	CodeCode Available
Advancing Singlish Understanding: Bridging the Gap with Datasets and Multimodal Models	Jan 2, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available

Show:10 25 50

← PrevPage 383 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified