Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3401–3425 of 10817 papers

Title	Date	Tasks	Status	Score
A Unified Hallucination Mitigation Framework for Large Vision-Language Models	Sep 24, 2024	HallucinationQuestion Answering	CodeCode Available	5
InterroLang: Exploring NLP Models and Datasets through Dialogue-based Explanations	Oct 9, 2023	Dialogue Act ClassificationHate Speech Detection	CodeCode Available	5
A Claim Decomposition Benchmark for Long-form Answer Verification	Oct 16, 2024	FormHallucination	CodeCode Available	5
EQuANt (Enhanced Question Answer Network)	Jun 24, 2019	Machine Reading ComprehensionMulti-Task Learning	CodeCode Available	5
Interpretable Multi-hop Reasoning for Forecasting Future Links on Temporal Knowledge Graphs	Sep 29, 2021	Knowledge GraphsQuestion Answering	CodeCode Available	5
RankAlign: A Ranking View of the Generator-Validator Gap in Large Language Models	Apr 15, 2025	Question Answering	CodeCode Available	5
Cross-Lingual Training for Automatic Question Generation	Jun 6, 2019	Natural Language UnderstandingQuestion Answering	CodeCode Available	5
Cross-Lingual Text-Rich Visual Comprehension: An Information Theory Perspective	Dec 23, 2024	Question AnsweringVisual Question Answering	CodeCode Available	5
Interpretable Natural Language Segmentation Based on Link Grammar	Nov 14, 2020	Question AnsweringRetrieval	CodeCode Available	5
IntKB: A Verifiable Interactive Framework for Knowledge Base Completion	Dec 1, 2020	Knowledge Base CompletionQuestion Answering	CodeCode Available	5
Can BERT Refrain from Forgetting on Sequential Tasks? A Probing Study	Mar 2, 2023	Extractive Question-AnsweringIncremental Learning	CodeCode Available	5
Interactive Natural Language-based Person Search	Feb 19, 2020	Person SearchQuestion Answering	CodeCode Available	5
Interactive Text Ranking with Bayesian Optimisation: A Case Study on Community QA and Summarisation	Nov 22, 2019	Bayesian OptimisationCommunity Question Answering	CodeCode Available	5
Cross-Lingual Question Answering over Knowledge Base as Reading Comprehension	Feb 26, 2023	Cross-Lingual Question AnsweringMachine Reading Comprehension	CodeCode Available	5
Augmenting Visual Question Answering with Semantic Frame Information in a Multitask Learning Approach	Jan 31, 2020	Question AnsweringVisual Question Answering	CodeCode Available	5
Cross-lingual Information Retrieval with BERT	Apr 24, 2020	Cross-Lingual Information RetrievalDocument Ranking	CodeCode Available	5
Interactive Machine Comprehension with Information Seeking Agents	Aug 27, 2019	Decision MakingInformation Retrieval	CodeCode Available	5
ERNIE-Layout: Layout-Knowledge Enhanced Multi-modal Pre-training for Document Understanding	Jan 16, 2022	cross-modal alignmentDocument Classification	CodeCode Available	5
Cross-lingual Inference with A Chinese Entailment Graph	Mar 11, 2022	Entity TypingQuestion Answering	CodeCode Available	5
QPaug: Question and Passage Augmentation for Open-Domain Question Answering of LLMs	Jun 20, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	5
A Distributional and Orthographic Aggregation Model for English Derivational Morphology	Jul 1, 2018	abstractive question answeringMachine Translation	CodeCode Available	5
Interactive Instance-based Evaluation of Knowledge Base Question Answering	Nov 1, 2018	Entity LinkingKnowledge Base Question Answering	CodeCode Available	5
Integrating Semantic Knowledge into Lexical Embeddings Based on Information Content Measurement	Apr 1, 2017	Document ClassificationInformation Retrieval	CodeCode Available	5
Integrating question answering and text-to-SQL in Portuguese	Feb 8, 2022	Question AnsweringText to SQL	CodeCode Available	5
Intelligent Assistant for People with Low Vision Abilities	Nov 20, 2017	Question Answering	CodeCode Available	5

Show:10 25 50

← PrevPage 137 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified