Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8401–8450 of 10817 papers

Title	Date	Tasks	Status
Rewriting Conversational Utterances with Instructed Large Language Models	Oct 10, 2024	Conversational SearchQuestion Answering	—Unverified
Commonsense Knowledge in Wikidata	Aug 18, 2020	Common Sense ReasoningQuestion Answering	—Unverified
SafePath: Conformal Prediction for Safe LLM-Based Autonomous Navigation	May 14, 2025	Autonomous DrivingAutonomous Navigation	—Unverified
Generative Relation Linking for Question Answering over Knowledge Bases	Aug 16, 2021	Question AnsweringRelation	—Unverified
Combining Heterogeneous Models for Measuring Relational Similarity	Jun 1, 2013	Question Answering	—Unverified
SC-ML: Self-supervised Counterfactual Metric Learning for Debiased Visual Question Answering	Apr 4, 2023	counterfactualMetric Learning	—Unverified
SAGAN: A Machine Translation Approach for Cross-Lingual Textual Entailment	Jul 1, 2012	Document SummarizationInformation Retrieval	—Unverified
SAGAN: An approach to Semantic Textual Similarity based on Textual Entailment	Jul 1, 2012	Machine TranslationNatural Language Inference	—Unverified
SConU: Selective Conformal Uncertainty in Large Language Models	Apr 19, 2025	Conformal PredictionQuestion Answering	—Unverified
SAIL: Search-Augmented Instruction Learning	May 24, 2023	DenoisingFact Checking	—Unverified
ReWind: Understanding Long Videos with Instructed Learnable Memory	Nov 23, 2024	Large Language ModelQuestion Answering	—Unverified
Salience-Aware Event Chain Modeling for Narrative Understanding	Sep 22, 2021	Question Answering	—Unverified
Revolutionizing Retrieval-Augmented Generation with Enhanced PDF Structure Recognition	Jan 23, 2024	Question AnsweringRAG	—Unverified
Combining dependency information and generalization in a pattern-based approach to the classification of lexical-semantic relation instances	May 1, 2014	ClassificationGeneral Classification	—Unverified
Generating clickbait spoilers with an ensemble of large language models	May 25, 2024	Passage RetrievalQuestion Answering	—Unverified
Ask Your Neurons: A Neural-based Approach to Answering Questions about Images	May 5, 2015	Question Answering	—Unverified
Generating Answering Patterns from Factoid Arabic Questions	Sep 1, 2017	Information RetrievalQuestion Answering	—Unverified
Genie: Achieving Human Parity in Content-Grounded Datasets Generation	Jan 25, 2024	Long Form Question AnsweringQuestion Answering	—Unverified
Combining Deep Neural Reranking and Unsupervised Extraction for Multi-Query Focused Summarization	Feb 2, 2023	DiversityExtractive Summarization	—Unverified
Sample then Identify: A General Framework for Risk Control and Assessment in Multimodal Large Language Models	Oct 10, 2024	Conformal PredictionLanguage Modeling	—Unverified
Samsung Poland NLP Team at SemEval-2016 Task 1: Necessity for diversity; combining recursive autoencoders, WordNet and ensemble methods to measure semantic similarity.	Jun 1, 2016	DiversityMachine Translation	—Unverified
Samsung Research Poland (SRPOL) at SemEval-2022 Task 9: Hybrid Question Answering Using Semantic Roles	Jul 1, 2022	Question AnsweringResponse Generation	—Unverified
Revisiting the Superficial Alignment Hypothesis	Sep 27, 2024	Instruction FollowingMath	—Unverified
Samvaadhana: A Telugu Dialogue System in Hospital Domain	Nov 1, 2019	General ClassificationQuestion Answering	—Unverified
SandboxAQ's submission to MRL 2024 Shared Task on Multi-lingual Multi-task Information Retrieval	Oct 28, 2024	Information RetrievalMultilingual Named Entity Recognition	—Unverified
Sanitizing Synthetic Training Data Generation for Question Answering over Knowledge Graphs	Sep 10, 2020	Knowledge GraphsQuestion Answering	—Unverified
Sanity Check: A Strong Alignment and Information Retrieval Baseline for Question Answering	Jul 5, 2018	ARCInformation Retrieval	—Unverified
Sanskrit Knowledge-based Systems: Annotation and Computational Tools	Jun 26, 2024	Knowledge GraphsQuestion Answering	—Unverified
Revisiting the Primacy of English in Zero-shot Cross-lingual Transfer	Jun 30, 2021	Cross-Lingual TransferQuestion Answering	—Unverified
Generating Answer Candidates for Quizzes and Answer-Aware Question Generators	Aug 29, 2021	Question AnsweringQuestion Generation	—Unverified
SCIR-QA at SemEval-2017 Task 3: CNN Model Based on Similar and Dissimilar Information between Keywords for Question Similarity	Aug 1, 2017	Community Question AnsweringGraph Ranking	—Unverified
Revisiting the Open-Domain Question Answering Pipeline	Sep 2, 2020	Information RetrievalMachine Reading Comprehension	—Unverified
Revisiting the Evaluation of Theory of Mind through Question Answering	Nov 1, 2019	Question Answering	—Unverified
Generate, Transform, Answer: Question Specific Tool Synthesis for Tabular Data	Mar 17, 2023	Question Answering	—Unverified
Savaal: Scalable Concept-Driven Question Generation to Enhance Human Learning	Feb 18, 2025	Question AnsweringQuestion Generation	—Unverified
SA-VQA: Structured Alignment of Visual and Semantic Representations for Visual Question Answering	Jan 25, 2022	Question AnsweringVisual Question Answering	—Unverified
Say Less, Mean More: Leveraging Pragmatics in Retrieval-Augmented Generation	Feb 25, 2025	ARCPassage Retrieval	—Unverified
Geometric Feature Enhanced Knowledge Graph Embedding and Spatial Reasoning	Oct 24, 2024	Graph EmbeddingKnowledge Graph Embedding	—Unverified
SberQuAD -- Russian Reading Comprehension Dataset: Description and Analysis	Dec 20, 2019	Question AnsweringReading Comprehension	—Unverified
Revisiting the Evaluation for Cross Document Event Coreference	Dec 1, 2016	Document SummarizationMulti-Document Summarization	—Unverified
Generate then Select: Open-ended Visual Question Answering Guided by World Knowledge	May 30, 2023	Answer SelectionQuestion Answering	—Unverified
Combined Distributional and Logical Semantics	Jan 1, 2013	ClusteringQuestion Answering	—Unverified
Revisiting Multi-Modal LLM Evaluation	Aug 9, 2024	Chart UnderstandingOptical Character Recognition	—Unverified
Scalable Semantic Parsing with Partial Ontologies	Jul 1, 2015	Question AnsweringSemantic Parsing	—Unverified
Generate-then-Ground in Retrieval-Augmented Generation for Multi-hop Question Answering	Jun 21, 2024	Multi-hop Question AnsweringQuestion Answering	—Unverified
Adaptive Token Boundaries: Integrating Human Chunking Mechanisms into Multimodal LLMs	May 3, 2025	ChunkingQuestion Answering	—Unverified
Revisiting Large Language Models as Zero-shot Relation Extractors	Oct 8, 2023	Question AnsweringRelation	—Unverified
Ask to Understand: Question Generation for Multi-hop Question Answering	Mar 17, 2022	DiversityMulti-hop Question Answering	—Unverified
Revisiting EmbodiedQA: A Simple Baseline and Beyond	Apr 8, 2019	Embodied Question AnsweringQuestion Answering	—Unverified
Evidentiality-aware Retrieval for Overcoming Abstractiveness in Open-Domain Question Answering	Apr 6, 2023	Contrastive Learningcounterfactual	—Unverified

Show:10 25 50

← PrevPage 169 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified