Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5926–5950 of 10817 papers

Title	Date	Tasks	Status
ICL00 at SemEval-2016 Task 3: Translation-Based Method for CQA System	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
Do You Know What You Are Talking About? Characterizing Query-Knowledge Relevance For Reliable Retrieval Augmented Generation	Oct 10, 2024	MisinformationQuestion Answering	—Unverified
Conversational Knowledge Teaching Agent that uses a Knowledge Base	Sep 1, 2015	Grammatical Error CorrectionKnowledge Base Question Answering	—Unverified
ICE: Idiom and Collocation Extractor for Research and Education	Apr 1, 2017	POSQuestion Answering	—Unverified
Long-form Question Answering: An Iterative Planning-Retrieval-Generation Approach	Nov 15, 2023	FormLong Form Question Answering	—Unverified
Conversational Information Seeking	Jan 21, 2022	Conversational Question AnsweringConversational Recommendation	—Unverified
MedExpQA: Multilingual Benchmarking of Large Language Models for Medical Question Answering	Apr 8, 2024	BenchmarkingMedical Question Answering	—Unverified
longhorns at DADC 2022: How many linguists does it take to fool a Question Answering model? A systematic approach to adversarial attacks	Jun 29, 2022	Extractive Question-AnsweringQuestion Answering	—Unverified
longhorns at DADC 2022: How many linguists does it take to fool a Question Answering model? A systematic approach to adversarial attacks.	Jul 1, 2022	Extractive Question-AnsweringQuestion Answering	—Unverified
ICDAR 2019 Competition on Scene Text Visual Question Answering	Jun 30, 2019	Question AnsweringVisual Question Answering	—Unverified
Conversational Exploratory Search via Interactive Storytelling	Sep 15, 2017	Conversational SearchNavigate	—Unverified
A Taxonomy for Data Contamination in Large Language Models	Jul 11, 2024	Question Answering	—Unverified
A Talker Ensemble: the University of Wrocław's Entry to the NIPS 2017 Conversational Intelligence Challenge	May 21, 2018	ChatbotQuestion Answering	—Unverified
Conversational Answer Generation and Factuality for Reading Comprehension Question-Answering	Mar 11, 2021	Answer GenerationPassage Ranking	—Unverified
HySTER: A Hybrid Spatio-Temporal Event Reasoner	Jan 17, 2021	Inductive logic programmingQuestion Answering	—Unverified
Long-Tailed Question Answering in an Open World	May 11, 2023	Knowledge DistillationLanguage Modelling	—Unverified
Long-Term Memory Networks for Question Answering	Jul 6, 2017	Question Answering	—Unverified
Conversational AI : Open Domain Question Answering and Commonsense Reasoning	Sep 18, 2019	Common Sense ReasoningOpen-Domain Question Answering	—Unverified
Gaining Extra Supervision via Multi-task learning for Multi-Modal Video Question Answering	May 28, 2019	Inductive BiasMetric Learning	—Unverified
Medchain: Bridging the Gap Between LLM Agents and Clinical Practice through Interactive Sequential Benchmarking	Dec 2, 2024	BenchmarkingDecision Making	—Unverified
Hypo3D: Exploring Hypothetical Reasoning in 3D	Feb 2, 2025	Question AnsweringVisual Question Answering	—Unverified
Conv-CoA: Improving Open-domain Question Answering in Large Language Models via Conversational Chain-of-Action	May 28, 2024	Conversational Question AnsweringHallucination	—Unverified
Hyperlink-induced Pre-training for Passage Retrieval of Open-domain Question Answering	Nov 16, 2021	Open-Domain Question AnsweringPassage Retrieval	—Unverified
Drift to Remember	Sep 21, 2024	GPUimage-classification	—Unverified
ControversialQA: Exploring Controversy in Question Answering	Feb 10, 2023	Question Answering	—Unverified

Show:10 25 50

← PrevPage 238 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified