Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5951–6000 of 10817 papers

Title	Date	Tasks	Status
Conversational Exploratory Search via Interactive Storytelling	Sep 15, 2017	Conversational SearchNavigate	—Unverified
Looking Beyond Sentence-Level Natural Language Inference for Downstream Tasks	Sep 18, 2020	Natural Language InferenceQuestion Answering	—Unverified
Looking Beyond Sentence-Level Natural Language Inference for Question Answering and Text Summarization	Jun 1, 2021	Multiple-choiceNatural Language Inference	—Unverified
Looking Beyond the Surface: A Challenge Set for Reading Comprehension over Multiple Sentences	Jun 1, 2018	DiversityNatural Language Inference	—Unverified
A Taxonomy for Data Contamination in Large Language Models	Jul 11, 2024	Question Answering	—Unverified
Looking for Hyponyms in Vector Space	Jun 1, 2014	Information RetrievalQuestion Answering	—Unverified
A Talker Ensemble: the University of Wrocław's Entry to the NIPS 2017 Conversational Intelligence Challenge	May 21, 2018	ChatbotQuestion Answering	—Unverified
Conversational Answer Generation and Factuality for Reading Comprehension Question-Answering	Mar 11, 2021	Answer GenerationPassage Ranking	—Unverified
HySTER: A Hybrid Spatio-Temporal Event Reasoner	Jan 17, 2021	Inductive logic programmingQuestion Answering	—Unverified
Look, Read and Ask: Learning to Ask Questions by Reading Text in Images	Nov 23, 2022	Optical Character Recognition (OCR)Question Answering	—Unverified
Look to the Right: Mitigating Relative Position Bias in Extractive Question Answering	Oct 26, 2022	Extractive Question-AnsweringPosition	—Unverified
LoRA-Contextualizing Adaptation of Large Multimodal Models for Long Document Understanding	Nov 2, 2024	document understandingQuestion Answering	—Unverified
LoRE: Logit-Ranked Retriever Ensemble for Enhancing Open-Domain Question Answering	Oct 13, 2024	Answer GenerationLanguage Modeling	—Unverified
Conversational AI : Open Domain Question Answering and Commonsense Reasoning	Sep 18, 2019	Common Sense ReasoningOpen-Domain Question Answering	—Unverified
Gaining Extra Supervision via Multi-task learning for Multi-Modal Video Question Answering	May 28, 2019	Inductive BiasMetric Learning	—Unverified
A Confidence-Based Interface for Neuro-Symbolic Visual Question Answering	Nov 21, 2021	Question AnsweringTranslation	—Unverified
Meet EDGAR, a tutoring agent at MONSERRATE	Aug 1, 2013	Question AnsweringSpeech Recognition	—Unverified
Lost in OCR Translation? Vision-Based Approaches to Robust Document Retrieval	May 8, 2025	Computational EfficiencyOptical Character Recognition	—Unverified
Lost in Overlap: Exploring Logit-based Watermark Collision in LLMs	Mar 15, 2024	PhilosophyQuestion Answering	—Unverified
An Open-Source Software Toolkit & Benchmark Suite for the Evaluation and Adaptation of Multimodal Action Models	Jun 10, 2025	Action GenerationImage Captioning	—Unverified
Dr. Tux: A Question Answering System for Ubuntu users	Aug 25, 2018	Question Answering	—Unverified
Hypo3D: Exploring Hypothetical Reasoning in 3D	Feb 2, 2025	Question AnsweringVisual Question Answering	—Unverified
Conv-CoA: Improving Open-domain Question Answering in Large Language Models via Conversational Chain-of-Action	May 28, 2024	Conversational Question AnsweringHallucination	—Unverified
Hyperlink-induced Pre-training for Passage Retrieval of Open-domain Question Answering	Nov 16, 2021	Open-Domain Question AnsweringPassage Retrieval	—Unverified
ControversialQA: Exploring Controversy in Question Answering	Feb 10, 2023	Question Answering	—Unverified
Low-Resource Clickbait Spoiling for Indonesian via Question Answering	Oct 12, 2023	Question Answering	—Unverified
A System for Building FrameNet-like Corpus for the Biomedical Domain	Apr 1, 2014	Question AnsweringSemantic Role Labeling	—Unverified
Low Resource Dependency Parsing: Cross-lingual Parameter Sharing in a Neural Network Parser	Jul 1, 2015	Dependency ParsingMachine Translation	—Unverified
HyperGLM: HyperGraph for Video Scene Graph Generation and Anticipation	Nov 27, 2024	Graph GenerationQuestion Answering	—Unverified
Low-Resource Semantic Role Labeling	Jun 1, 2014	Information RetrievalMachine Translation	—Unverified
Hyper-dimensional computing for a visual question-answering system that is trainable end-to-end	Nov 28, 2017	Question AnsweringVisual Question Answering	—Unverified
DSNDM: Deep Siamese Neural Discourse Model with Attention for Text Pairs Categorization and Ranking	Nov 1, 2020	Question Answering	—Unverified
LRRA:A Transparent Neural-Symbolic Reasoning Framework for Real-World Visual Question Answering	Aug 1, 2021	Question AnsweringVisual Question Answering	—Unverified
A Systematic Survey of Prompt Engineering in Large Language Models: Techniques and Applications	Feb 5, 2024	Prompt EngineeringQuestion Answering	—Unverified
Controlling Risk of Web Question Answering	May 24, 2019	Machine Reading ComprehensionQuestion Answering	—Unverified
Addressing Uncertainty in LLMs to Enhance Reliability in Generative AI	Nov 4, 2024	Conformal PredictionPrediction	—Unverified
MedVLM-R1: Incentivizing Medical Reasoning Capability of Vision-Language Models (VLMs) via Reinforcement Learning	Feb 26, 2025	Domain GeneralizationMedical Image Analysis	—Unverified
Can You Explain That? Lucid Explanations Help Human-AI Collaborative Image Retrieval	Apr 5, 2019	Image RetrievalQuestion Answering	—Unverified
MedXChat: A Unified Multimodal Large Language Model Framework towards CXRs Understanding and Generation	Dec 4, 2023	Instruction FollowingLanguage Modeling	—Unverified
MF2-MVQA: A Multi-stage Feature Fusion method for Medical Visual Question Answering	Nov 11, 2022	Medical Visual Question AnsweringQuestion Answering	—Unverified
Mitigating Knowledge Conflicts in Language Model-Driven Question Answering	Nov 18, 2024	Document SummarizationHallucination	—Unverified
Lumos : Empowering Multimodal LLMs with Scene Text Recognition	Feb 12, 2024	Language ModelingLanguage Modelling	—Unverified
Modality Alignment between Deep Representations for Effective Video-and-Language Learning	Jun 1, 2022	Question AnsweringVideo Captioning	—Unverified
A Novel Approach Towards Incorporating Context Processing Capabilities in NLIDB System	Oct 1, 2013	Question Answering	—Unverified
Hyperbolic Attention Networks	May 24, 2018	Machine TranslationQuestion Answering	—Unverified
HyPA-RAG: A Hybrid Parameter Adaptive Retrieval-Augmented Generation System for AI Legal and Policy Applications	Aug 29, 2024	Question AnsweringRAG	—Unverified
Controlled Natural Languages and Default Reasoning	May 11, 2019	ImplicaturesLogical Reasoning	—Unverified
Dual Capsule Attention Mask Network with Mutual Learning for Visual Question Answering	Oct 1, 2022	Question AnsweringVisual Question Answering	—Unverified
Hybrid-SQuAD: Hybrid Scholarly Question Answering Dataset	Dec 3, 2024	Knowledge GraphsLanguage Modeling	—Unverified
Hybrid Question Answering over Knowledge Base and Free Text	Dec 1, 2016	Information RetrievalQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 120 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified