Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4901–4950 of 10817 papers

Title	Date	Tasks	Status
Knowledge-Aware Diverse Reranking for Cross-Source Question Answering	Jun 25, 2025	Question AnsweringRAG	—Unverified
Instruction-Guided Scene Text Recognition	Jan 31, 2024	Question AnsweringScene Text Recognition	—Unverified
Knowledge-Aware Reasoning over Multimodal Semi-structured Tables	Aug 25, 2024	Multimodal ReasoningQuestion Answering	—Unverified
Instruction-Oriented Preference Alignment for Enhancing Multi-Modal Comprehension Capability of MLLMs	Mar 26, 2025	HallucinationHallucination Evaluation	—Unverified
Coupling Knowledge-Based and Data-Driven Systems for Named Entity Recognition	Apr 1, 2012	Information Retrievalnamed-entity-recognition	—Unverified
InstructRetro: Instruction Tuning post Retrieval-Augmented Pretraining	Oct 11, 2023	4kDecoder	—Unverified
Insurance Question Answering via Single-turn Dialogue Modeling	Oct 1, 2022	Intent DetectionQuestion Answering	—Unverified
Integer Linear Programming formulations in Natural Language Processing	Apr 1, 2017	Dependency ParsingNatural Language Inference	—Unverified
Integrating Cognitive AI with Generative Models for Enhanced Question Answering in Skill-based Learning	Jul 28, 2024	Question Answering	—Unverified
Integrating Deep Linguistic Features in Factuality Prediction over Unified Datasets	Jul 1, 2017	Knowledge Base PopulationPrediction	—Unverified
Improving Reliability and Explainability of Medical Question Answering through Atomic Fact Checking in Retrieval-Augmented LLMs	May 30, 2025	Fact CheckingHallucination	—Unverified
Integrating Hierarchical Semantic into Iterative Generation Model for Entailment Tree Explanation	Sep 26, 2024	Question Answering	—Unverified
An approach based on Open Research Knowledge Graph for Knowledge Acquisition from scientific papers	Aug 23, 2023	Graph MatchingQuestion Answering	—Unverified
Integrating Knowledge and Reasoning in Image Understanding	Jun 24, 2019	Object RecognitionQuestion Answering	—Unverified
Improving Question Classification by Feature Extraction and Selection	Jan 1, 2016	Classificationfeature selection	—Unverified
Integrating Location, Visibility, and Question-Answering in a Spoken Dialogue System for Pedestrian City Exploration	Jul 1, 2012	Question Answering	—Unverified
Integrating Multi-Head Convolutional Encoders with Cross-Attention for Improved SPARQL Query Translation	Aug 24, 2024	Graph Question AnsweringMachine Translation	—Unverified
Integrating Object Detection Modality into Visual Language Model for Enhanced Autonomous Driving Agent	Nov 8, 2024	Autonomous DrivingLanguage Modeling	—Unverified
AttentionMeSH: Simple, Effective and Interpretable Automatic MeSH Indexer	Nov 1, 2018	ArticlesInformation Retrieval	—Unverified
A Diffusion-based Method for Multi-turn Compositional Image Generation	Apr 5, 2023	DenoisingImage Generation	—Unverified
Improving Question Answering with Generation of NQ-like Questions	Oct 12, 2022	Natural QuestionsQuestion Answering	—Unverified
Integrating Question Rewrites in Conversational Question Answering: A Reinforcement Learning Approach	May 1, 2022	Conversational Question AnsweringQuestion Answering	—Unverified
Attention Mechanism based Cognition-level Scene Understanding	Apr 17, 2022	Question AnsweringScene Understanding	—Unverified
Integrating Subgraph-aware Relation and DirectionReasoning for Question Answering	Apr 1, 2021	Question AnsweringRelation	—Unverified
Integrating Subject, Type, and Property Identification for Simple Question Answering over Knowledge Base	Nov 1, 2017	Question AnsweringRelation	—Unverified
Integrating Vision and Language Datasets to Measure Word Concreteness	Nov 1, 2017	Image CaptioningImage Retrieval	—Unverified
PolQA: Polish Question Answering Dataset	Dec 17, 2022	Open-Domain Question AnsweringPassage Retrieval	—Unverified
Large Language Models Can Better Understand Knowledge Graphs Than We Thought	Feb 18, 2024	Knowledge GraphsPrompt Engineering	—Unverified
Analyzing Patient Records to Establish If and When a Patient Suffered from a Medical Condition	Jun 1, 2012	Information RetrievalQuestion Answering	—Unverified
Knowledge Acquisition for Visual Question Answering via Iterative Querying	Jul 1, 2017	Question AnsweringVisual Question Answering	—Unverified
Intent Recognition in Conversational Recommender Systems	Dec 6, 2022	ChatbotFeature Engineering	—Unverified
Knowledge-Aided Open-Domain Question Answering	Jun 9, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified
Interactive Attention AI to translate low light photos to captions for night scene understanding in women safety	Jan 4, 2022	DecoderDeep Learning	—Unverified
Biomedical Evidence Generation Engine	Nov 11, 2019	Information RetrievalQuestion Answering	—Unverified
Improving Question Answering over Knowledge Graphs Using Graph Summarization	Mar 25, 2022	Entity EmbeddingsGraph Embedding	—Unverified
Attention is Not Always What You Need: Towards Efficient Classification of Domain-Specific Text	Mar 31, 2023	Question AnsweringSentiment Analysis	—Unverified
InteractiveIE: Towards Assessing the Strength of Human-AI Collaboration in Improving the Performance of Information Extraction	May 24, 2023	Question AnsweringQuestion Generation	—Unverified
Cross-lingual Transfer of Semantic Role Labeling Models	Aug 1, 2013	Cross-Lingual TransferLanguage Modelling	—Unverified
Improving Question Answering Model Robustness with Synthetic Adversarial Data Generation	Apr 18, 2021	Answer SelectionQuestion Answering	—Unverified
Improving Question Answering by Commonsense-Based Pre-Training	Sep 5, 2018	Question Answering	—Unverified
Counterfactual Vision-and-Language Navigation: Unravelling the Unseen	Dec 1, 2020	counterfactualEmbodied Question Answering	—Unverified
Knowing Where to Look? Analysis on Attention of Visual Question Answering System	Oct 9, 2018	Question AnsweringVisual Question Answering	—Unverified
Improving Query Graph Generation for Complex Question Answering over Knowledge Base	Nov 1, 2021	Graph GenerationQuestion Answering	—Unverified
Interactive Mongolian Question Answer Matching Model Based on Attention Mechanism in the Law Domain	Oct 1, 2022	Question Answering	—Unverified
Interactive Natural Language Query Construction for Report Generation	May 1, 2012	Question AnsweringText Generation	—Unverified
Interactive-Predictive Machine Translation based on Syntactic Constraints of Prefix	Dec 1, 2016	Machine TranslationQuestion Answering	—Unverified
Analyzing Mitigation Strategies for Catastrophic Forgetting in End-to-End Training of Spoken Language Models	May 23, 2025	Continual LearningQuestion Answering	—Unverified
Interactive Question Answering Systems: Literature Review	Sep 4, 2022	Question Answering	—Unverified
Improving QA Efficiency with DistilBERT: Fine-Tuning and Inference on mobile Intel CPUs	May 28, 2025	Computational EfficiencyCPU	—Unverified
Counterfactual Vision and Language Learning	Jun 1, 2020	counterfactualQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 99 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified