Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2201–2250 of 10817 papers

Title	Date	Tasks	Status	Hype	Score
Did Aristotle Use a Laptop? A Question Answering Benchmark with Implicit Reasoning Strategies	Jan 6, 2021	Question AnsweringStrategyQA	CodeCode Available	1	5
Multimodal fusion of imaging and genomics for lung cancer recurrence prediction	Feb 5, 2020	Computed Tomography (CT)Question Answering	CodeCode Available	1	5
Multimodality Representation Learning: A Survey on Evolution, Pretraining and Its Applications	Feb 1, 2023	Question AnsweringRepresentation Learning	CodeCode Available	1	5
Consistency-preserving Visual Question Answering in Medical Imaging	Jun 27, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1	5
Consistency Regularization for Cross-Lingual Fine-Tuning	Jun 15, 2021	Machine TranslationQuestion Answering	CodeCode Available	1	5
MDETR -- Modulated Detection for End-to-End Multi-Modal Understanding	Apr 26, 2021	Generalized Referring Expression ComprehensionPhrase Grounding	CodeCode Available	1	5
Why So Gullible? Enhancing the Robustness of Retrieval-Augmented Models against Counterfactual Noise	May 2, 2023	counterfactualFew-Shot Learning	CodeCode Available	1	5
Contextualized Sparse Representations for Real-Time Open-Domain Question Answering	Nov 7, 2019	Information RetrievalOpen-Domain Question Answering	CodeCode Available	1	5
Learning Video Context as Interleaved Multimodal Sequences	Jul 31, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Discourse Analysis via Questions and Answers: Parsing Dependency Structures of Questions Under Discussion	Oct 12, 2022	Dependency ParsingQuestion Answering	CodeCode Available	1	5
Discovering Spatio-Temporal Rationales for Video Question Answering	Jul 22, 2023	Question AnsweringVideo Question Answering	CodeCode Available	1	5
ConTEXTual Net: A Multimodal Vision-Language Model for Segmentation of Pneumothorax	Mar 2, 2023	DescriptiveImage Captioning	CodeCode Available	1	5
Multi-Relational Embedding for Knowledge Graph Representation and Analysis	Sep 28, 2020	Computational EfficiencyGraph Embedding	CodeCode Available	1	5
Constructing A Multi-hop QA Dataset for Comprehensive Evaluation of Reasoning Steps	Nov 2, 2020	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1	5
Disentangling 3D Prototypical Networks For Few-Shot Concept Learning	Nov 6, 2020	3D geometry3D Object Detection	CodeCode Available	1	5
MultiSpanQA: A Dataset for Multi-Span Question Answering	Jul 1, 2022	Natural QuestionsQuestion Answering	CodeCode Available	1	5
DisentQA: Disentangling Parametric and Contextual Knowledge with Counterfactual Question Answering	Nov 10, 2022	counterfactualData Augmentation	CodeCode Available	1	5
Constructing Benchmarks and Interventions for Combating Hallucinations in LLMs	Apr 15, 2024	HallucinationLanguage Modeling	CodeCode Available	1	5
Distantly-Supervised Dense Retrieval Enables Open-Domain Question Answering without Evidence Annotation	Nov 1, 2021	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1	5
Distantly-Supervised Evidence Retrieval Enables Question Answering without Evidence Annotation	Oct 10, 2021	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1	5
Distilled Dual-Encoder Model for Vision-Language Understanding	Dec 16, 2021	Image to textmodel	CodeCode Available	1	5
Distilling Knowledge from Reader to Retriever for Question Answering	Dec 8, 2020	Information RetrievalKnowledge Distillation	CodeCode Available	1	5
Contrast and Classify: Training Robust VQA Models	Oct 13, 2020	Contrastive LearningData Augmentation	CodeCode Available	1	5
Does Vision-and-Language Pretraining Improve Lexical Grounding?	Sep 21, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1	5
A Survey of Medical Vision-and-Language Applications and Their Techniques	Nov 19, 2024	Decision MakingDiagnostic	CodeCode Available	1	5
Diversify Question Generation with Retrieval-Augmented Style Transfer	Oct 23, 2023	DiversityQuestion Answering	CodeCode Available	1	5
Context-Aware Alignment and Mutual Masking for 3D-Language Pre-Training	Jan 1, 2023	3D dense captioning3D visual grounding	CodeCode Available	1	5
Context-Aware Answer Extraction in Question Answering	Nov 5, 2020	Multi-Task LearningPrediction	CodeCode Available	1	5
Dense-Caption Matching and Frame-Selection Gating for Temporal Localization in VideoQA	May 13, 2020	Image CaptioningMulti-Label Classification	CodeCode Available	1	5
Natural Language Embedded Programs for Hybrid Language Symbolic Reasoning	Sep 19, 2023	Instruction FollowingLanguage Modeling	CodeCode Available	1	5
Code-Style In-Context Learning for Knowledge-Based Question Answering	Sep 9, 2023	Code GenerationIn-Context Learning	CodeCode Available	1	5
DocNLI: A Large-scale Dataset for Document-level Natural Language Inference	Jun 17, 2021	Natural Language InferenceQuestion Answering	CodeCode Available	1	5
Hierarchical multimodal transformers for Multi-Page DocVQA	Dec 7, 2022	DecoderQuestion Answering	CodeCode Available	1	5
MedChatZH: a Better Medical Adviser Learns from Better Instructions	Sep 3, 2023	Question Answering	CodeCode Available	1	5
MemeCap: A Dataset for Captioning and Interpreting Memes	May 23, 2023	Image CaptioningMeme Captioning	CodeCode Available	1	5
DocVQA: A Dataset for VQA on Document Images	Jul 1, 2020	Question AnsweringReading Comprehension	CodeCode Available	1	5
Mitigating Hallucinations in Vision-Language Models through Image-Guided Head Suppression	May 22, 2025	HallucinationImage Description	CodeCode Available	1	5
OpenBias: Open-set Bias Detection in Text-to-Image Generative Models	Apr 11, 2024	Bias DetectionFairness	CodeCode Available	1	5
Q&A Prompts: Discovering Rich Visual Clues through Mining Question-Answer Prompts for VQA requiring Diverse World Knowledge	Jan 19, 2024	Question AnsweringQuestion Generation	CodeCode Available	1	5
SlotFormer: Unsupervised Visual Dynamics Simulation with Object-Centric Models	Oct 12, 2022	ObjectQuestion Answering	CodeCode Available	1	5
Ask Me Anything: Dynamic Memory Networks for Natural Language Processing	Jun 24, 2015	General ClassificationPart-Of-Speech Tagging	CodeCode Available	0	5
MATHSENSEI: A Tool-Augmented Large Language Model for Mathematical Reasoning	Feb 27, 2024	8kLanguage Modeling	CodeCode Available	0	5
CODAH: An Adversarially-Authored Question Answering Dataset for Common Sense	Jun 1, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available	0	5
Matching Article Pairs with Graphical Decomposition and Convolutions	Feb 21, 2018	Articlesdocument understanding	CodeCode Available	0	5
MatchZoo: A Learning, Practicing, and Developing System for Neural Text Matching	May 24, 2019	Information RetrievalQuestion Answering	CodeCode Available	0	5
Alloprof: a new French question-answer education dataset and its use in an information retrieval case study	Feb 10, 2023	Information RetrievalQuestion Answering	CodeCode Available	0	5
MatchZoo: A Toolkit for Deep Text Matching	Jul 23, 2017	Ad-Hoc Information RetrievalInformation Retrieval	CodeCode Available	0	5
Co-attending Regions and Detections with Multi-modal Multiplicative Embedding for VQA	Nov 18, 2017	FormQuestion Answering	CodeCode Available	0	5
Masking Orchestration: Multi-task Pretraining for Multi-role Dialogue Representation Learning	Feb 27, 2020	Dialogue UnderstandingQuestion Answering	CodeCode Available	0	5
Marten: Visual Question Answering with Mask Generation for Multi-modal Document Understanding	Mar 18, 2025	document understandingQuestion Answering	CodeCode Available	0	5

Show:10 25 50

← PrevPage 45 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified