Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1601–1625 of 10817 papers

Title	Date	Tasks	Status	Hype
Differentiable Reasoning on Large Knowledge Bases and Natural Language	Dec 17, 2019	Link PredictionQuestion Answering	CodeCode Available	1
Did Aristotle Use a Laptop? A Question Answering Benchmark with Implicit Reasoning Strategies	Jan 6, 2021	Question AnsweringStrategyQA	CodeCode Available	1
Distantly-Supervised Evidence Retrieval Enables Question Answering without Evidence Annotation	Oct 10, 2021	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
A Survey on Efficient Vision-Language Models	Apr 13, 2025	Image CaptioningQuestion Answering	CodeCode Available	1
Mintaka: A Complex, Natural, and Multilingual Dataset for End-to-End Question Answering	Oct 4, 2022	Question Answering	CodeCode Available	1
MISS: A Generative Pretraining and Finetuning Approach for Med-VQA	Jan 10, 2024	Medical Visual Question AnsweringMulti-Task Learning	CodeCode Available	1
Mitigating the Impact of False Negatives in Dense Retrieval with Contrastive Confidence Regularization	Dec 30, 2023	Answer GenerationContrastive Learning	CodeCode Available	1
Bridging Anaphora Resolution as Question Answering	Apr 16, 2020	Bridging Anaphora ResolutionQuestion Answering	CodeCode Available	1
Mitigating the Position Bias of Transformer Models in Passage Re-Ranking	Jan 18, 2021	Passage Re-RankingPosition	CodeCode Available	1
Mitigating Unintended Memorization with LoRA in Federated Learning for LLMs	Feb 7, 2025	Federated LearningMedical Question Answering	CodeCode Available	1
Dialog Inpainting: Turning Documents into Dialogs	May 18, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
DialogLM: Pre-trained Model for Long Dialogue Understanding and Summarization	Sep 6, 2021	abstractive question answeringDenoising	CodeCode Available	1
DeVLBert: Learning Deconfounded Visio-Linguistic Representations	Aug 16, 2020	Image RetrievalQuestion Answering	CodeCode Available	1
MKQA: A Linguistically Diverse Benchmark for Multilingual Open Domain Question Answering	Jul 30, 2020	Extractive Question-AnsweringNatural Questions	CodeCode Available	1
A Critical Evaluation of Evaluations for Long-form Question Answering	May 29, 2023	FormLong Form Question Answering	CodeCode Available	1
Bridging the Gap between 2D and 3D Visual Question Answering: A Fusion Approach for 3D VQA	Feb 24, 2024	3D Question Answering (3D-QA)Question Answering	CodeCode Available	1
MMFT-BERT: Multimodal Fusion Transformer with BERT Encodings for Visual Question Answering	Oct 27, 2020	DiagnosticQuestion Answering	CodeCode Available	1
Development and bilingual evaluation of Japanese medical large language model within reasonably low computational resources	Sep 18, 2024	GPULanguage Modeling	CodeCode Available	1
DEXTER: A Benchmark for open-domain Complex Question Answering using LLMs	Jun 24, 2024	Question AnsweringRetrieval	CodeCode Available	1
MM-PoisonRAG: Disrupting Multimodal RAG with Local and Global Poisoning Attacks	Feb 25, 2025	MisinformationQuestion Answering	CodeCode Available	1
Detecting and Preventing Hallucinations in Large Vision Language Models	Aug 11, 2023	16kHallucination	CodeCode Available	1
MM-Skin: Enhancing Dermatology Vision-Language Model with an Image-Text Dataset Derived from Textbooks	May 9, 2025	DiagnosticInstruction Following	CodeCode Available	1
Bridging the KB-Text Gap: Leveraging Structured Knowledge-aware Pre-training for KBQA	Aug 28, 2023	Knowledge Base Question AnsweringQuestion Answering	CodeCode Available	1
A Cross-Task Analysis of Text Span Representations	Jun 6, 2020	coreference-resolutionCoreference Resolution	CodeCode Available	1
Building Efficient and Effective OpenQA Systems for Low-Resource Languages	Jan 7, 2024	Machine TranslationQuestion Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 65 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified