Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2851–2875 of 10817 papers

Title	Date	Tasks	Status
SMART-RAG: Selection using Determinantal Matrices for Augmented Retrieval	Sep 21, 2024	DiversityPoint Processes	—Unverified
Enhancing Dual-Encoders with Question and Answer Cross-Embeddings for Answer Retrieval	Jun 7, 2022	Question AnsweringRepresentation Learning	—Unverified
Enhancing Event Causality Identification with Rationale and Structure-Aware Causal Question Answering	Mar 17, 2024	Event Causality IdentificationMultiple-choice	—Unverified
BR-TaxQA-R: A Dataset for Question Answering with References for Brazilian Personal Income Tax Law, including case law	May 21, 2025	Answer GenerationQuestion Answering	—Unverified
BRIT: Bidirectional Retrieval over Unified Image-Text Graph	May 24, 2025	Image to textQuestion Answering	—Unverified
Answer ranking in Community Question Answering: a deep learning approach	Oct 16, 2022	AttributeCommunity Question Answering	—Unverified
Bring Remote Sensing Object Detect Into Nature Language Model: Using SFT Method	Mar 11, 2025	Language ModelingLanguage Modelling	—Unverified
Answer Ranking for Product-Related Questions via Multiple Semantic Relations Modeling	Jun 28, 2020	Natural Language InferenceQuestion Answering	—Unverified
A Graph-Guided Reasoning Approach for Open-ended Commonsense Question Answering	Mar 18, 2023	Multiple-choiceQuestion Answering	—Unverified
A Graph-guided Multi-round Retrieval Method for Conversational Open-domain Question Answering	Apr 17, 2021	Conversational Question AnsweringOpen-Domain Question Answering	—Unverified
A Crowdsourcing Approach for Annotating Causal Relation Instances in Wikipedia	Nov 1, 2017	Named Entity Recognition (NER)Question Answering	—Unverified
Exploring and Analyzing Machine Commonsense Benchmarks	Dec 21, 2020	Common Sense ReasoningQuestion Answering	—Unverified
Enhancing Explainability in Multimodal Large Language Models Using Ontological Context	Sep 27, 2024	Image CaptioningQuestion Answering	—Unverified
Bridging the Training-Inference Gap in LLMs by Leveraging Self-Generated Tokens	Oct 18, 2024	MathQuestion Answering	—Unverified
Answer Presentation in Question Answering over Linked Data using Typed Dependency Subtree Patterns	Dec 1, 2016	Dependency ParsingInformation Retrieval	—Unverified
Bridging the Training-Inference Gap for Dense Phrase Retrieval	Oct 25, 2022	Open-Domain Question AnsweringPassage Retrieval	—Unverified
Bridging the Semantic Gaps: Improving Medical VQA Consistency with LLM-Augmented Question Sets	Apr 16, 2025	DiversityMedical Visual Question Answering	—Unverified
A Graph-Based Approach to String Regeneration	Apr 1, 2014	Language ModellingQuestion Answering	—Unverified
Bridging the Preference Gap between Retrievers and LLMs	Jan 13, 2024	Question AnsweringRAG	—Unverified
Bridging the Language Gap: Knowledge Injected Multilingual Question Answering	Apr 6, 2023	Cross-Lingual TransferExtractive Question-Answering	—Unverified
Answer-Me: Multi-Task Open-Vocabulary Visual Question Answering	May 2, 2022	DecoderImage Captioning	—Unverified
Bridging the Knowledge Gap: Enhancing Question Answering with World and Domain Knowledge	Oct 16, 2019	ArticlesQuestion Answering	—Unverified
AGRaME: Any-Granularity Ranking with Multi-Vector Embeddings	May 23, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified
Abacus: A Cost-Based Optimizer for Semantic Operator Systems	May 20, 2025	Question Answering	—Unverified
Bridging the Gap: Dynamic Learning Strategies for Improving Multilingual Performance in LLMs	May 28, 2024	Question AnsweringRAG	—Unverified

Show:10 25 50

← PrevPage 115 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified