Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3376–3400 of 10817 papers

Title	Date	Tasks	Status	Score
iREL at SemEval-2024 Task 9: Improving Conventional Prompting Methods for Brain Teasers	May 25, 2024	Common Sense ReasoningMultiple-choice	CodeCode Available	5
Introducing MathQA -- A Math-Aware Question Answering System	Jun 28, 2019	MathQuestion Answering	CodeCode Available	5
IntKB: A Verifiable Interactive Framework for Knowledge Base Completion	Dec 1, 2020	Knowledge Base CompletionQuestion Answering	CodeCode Available	5
Intrinsic Subgraph Generation for Interpretable Graph based Visual Question Answering	Mar 26, 2024	Decision MakingExplainable artificial intelligence	CodeCode Available	5
Interpretable Proof Generation via Iterative Backward Reasoning	May 22, 2022	Question Answering	CodeCode Available	5
EntGPT: Linking Generative Large Language Models with Knowledge Bases	Feb 9, 2024	Entity DisambiguationEntity Linking	CodeCode Available	5
Question-Answering System Extracts Information on Injection Drug Use from Clinical Notes	May 15, 2023	Question Answering	CodeCode Available	5
Cross-Pair Text Representations for Answer Sentence Selection	Oct 1, 2018	Natural Language InferenceOpen-Domain Question Answering	CodeCode Available	5
AutoBench-V: Can Large Vision-Language Models Benchmark Themselves?	Oct 28, 2024	BenchmarkingQuestion Answering	CodeCode Available	5
InterroLang: Exploring NLP Models and Datasets through Dialogue-based Explanations	Oct 9, 2023	Dialogue Act ClassificationHate Speech Detection	CodeCode Available	5
IRGAN: A Minimax Game for Unifying Generative and Discriminative Information Retrieval Models	May 30, 2017	Ad-Hoc Information RetrievalDocument Ranking	CodeCode Available	5
Leveraging QA Datasets to Improve Generative Data Augmentation	May 25, 2022	Common Sense ReasoningData Augmentation	CodeCode Available	5
Question Condensing Networks for Answer Selection in Community Question Answering	Jul 1, 2018	Answer SelectionCommunity Question Answering	CodeCode Available	5
ADKGD: Anomaly Detection in Knowledge Graphs with Dual-Channel Training	Jan 13, 2025	Anomaly DetectionKnowledge Graphs	CodeCode Available	5
Cross-Modal Contrastive Learning for Robust Reasoning in VQA	Nov 21, 2022	Contrastive LearningQuestion Answering	CodeCode Available	5
A Unified Syntax-aware Framework for Semantic Role Labeling	Oct 1, 2018	Machine TranslationQuestion Answering	CodeCode Available	5
Interpretable Multi-hop Reasoning for Forecasting Future Links on Temporal Knowledge Graphs	Sep 29, 2021	Knowledge GraphsQuestion Answering	CodeCode Available	5
A Unified Hallucination Mitigation Framework for Large Vision-Language Models	Sep 24, 2024	HallucinationQuestion Answering	CodeCode Available	5
Interactive Machine Comprehension with Information Seeking Agents	Aug 27, 2019	Decision MakingInformation Retrieval	CodeCode Available	5
Question Similarity in Community Question Answering: A Systematic Exploration of Preprocessing Methods and Models	Sep 1, 2019	Community Question AnsweringQuestion Answering	CodeCode Available	5
Interactive Natural Language-based Person Search	Feb 19, 2020	Person SearchQuestion Answering	CodeCode Available	5
EpiK-Eval: Evaluation for Language Models as Epistemic Models	Oct 23, 2023	Question Answering	CodeCode Available	5
Episodic Memory in Lifelong Language Learning	Jun 3, 2019	Continual LearningGeneral Classification	CodeCode Available	5
A Claim Decomposition Benchmark for Long-form Answer Verification	Oct 16, 2024	FormHallucination	CodeCode Available	5
Interactive Instance-based Evaluation of Knowledge Base Question Answering	Nov 1, 2018	Entity LinkingKnowledge Base Question Answering	CodeCode Available	5

Show:10 25 50

← PrevPage 136 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified