Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7051–7075 of 10817 papers

Title	Date	Tasks	Status
One vs. Many QA Matching with both Word-level and Sentence-level Attention Network	Aug 1, 2018	Question AnsweringReading Comprehension	—Unverified
On Generality and Knowledge Transferability in Cross-Domain Duplicate Question Detection for Heterogeneous Community Question Answering	Nov 15, 2018	Community Question AnsweringDomain Adaptation	—Unverified
On Generating Characteristic-rich Question Sets for QA Evaluation	Nov 1, 2016	Question Answering	—Unverified
On Incorporating Semantic Prior Knowlegde in Deep Learning Through Embedding-Space Constraints	Sep 25, 2019	Data AugmentationQuestion Answering	—Unverified
On Incorporating Semantic Prior Knowledge in Deep Learning Through Embedding-Space Constraints	Sep 30, 2019	Data AugmentationQuestion Answering	—Unverified
On Knowledge distillation from complex networks for response prediction	Jun 1, 2019	Knowledge DistillationQuestion Answering	—Unverified
Online Continual Knowledge Learning for Language Models	Nov 16, 2023	Continual LearningFact Checking	—Unverified
Hallucination-minimized Data-to-answer Framework for Financial Decision-makers	Nov 9, 2023	Decision MakingHallucination	—Unverified
On Making Reading Comprehension More Comprehensive	Nov 1, 2019	Machine Reading ComprehensionQuestion Answering	—Unverified
On Measuring Social Biases in Prompt-Based Learning	Jan 16, 2022	FormLanguage Modelling	—Unverified
Hallucination Detection: Robustly Discerning Reliable Answers in Large Language Models	Jul 4, 2024	HallucinationQuestion Answering	—Unverified
On Mechanistic Circuits for Extractive Question-Answering	Feb 12, 2025	Extractive Question-AnsweringLanguage Modeling	—Unverified
On metric embedding for boosting semantic similarity computations	Jul 1, 2015	Information RetrievalOpen-Domain Question Answering	—Unverified
EVE: Efficient Vision-Language Pre-training with Masked Prediction and Modality-Aware MoE	Aug 23, 2023	Image-text matchingImage-text Retrieval	—Unverified
Event analysis for information extraction from business-based technical documents	Jun 1, 2015	Question Answering	—Unverified
ConQuest: Contextual Question Paraphrasing through Answer-Aware Synthetic Question Generation	Nov 1, 2021	Natural QuestionsQuestion Answering	—Unverified
Optimizing open-domain question answering with graph-based retrieval augmented generation	Mar 4, 2025	BenchmarkingLanguage Modeling	—Unverified
On scalable oversight with weak LLMs judging strong LLMs	Jul 5, 2024	Multimodal ReasoningQuestion Answering	—Unverified
On Scaling Up a Multilingual Vision and Language Model	Jan 1, 2024	document understandingIn-Context Learning	—Unverified
On Significance of Subword tokenization for Low Resource and Efficient Named Entity Recognition: A case study in Marathi	Dec 3, 2023	Computational EfficiencyMachine Translation	—Unverified
Optimizing Visual Question Answering Models for Driving: Bridging the Gap Between Human and Machine Attention Patterns	Jun 13, 2024	Autonomous DrivingQuestion Answering	—Unverified
On the Cognition of Visual Question Answering Models and Human Intelligence: A Comparative Study	Oct 4, 2023	Question AnsweringVisual Question Answering	—Unverified
Event Detection via Derangement Question Answering	Nov 16, 2021	Event DetectionQuestion Answering	—Unverified
On the Distribution, Sparsity, and Inference-time Quantization of Attention Values in Transformers	Jun 2, 2021	QuantizationQuestion Answering	—Unverified
Option Comparison Network for Multiple-choice Reading Comprehension	Mar 7, 2019	Multiple-choiceQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 283 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified