Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7201–7225 of 10817 papers

Title	Date	Tasks	Status
An Empirical Study of Combing Multiple Models in Bengali Question Classification	Oct 1, 2013	Decision MakingGeneral Classification	—Unverified
KgPLM: Knowledge-guided Language Model Pre-training via Generative and Discriminative Learning	Dec 7, 2020	Language ModelingLanguage Modelling	—Unverified
Order Matters: Exploring Order Sensitivity in Multimodal Large Language Models	Oct 22, 2024	In-Context LearningQuestion Answering	—Unverified
KG-MTT-BERT: Knowledge Graph Enhanced BERT for Multi-Type Medical Text Classification	Oct 8, 2022	ClassificationQuestion Answering	—Unverified
KGI: An Integrated Framework for Knowledge Intensive Language Tasks	Apr 8, 2022	Fact CheckingOpen-Domain Question Answering	—Unverified
ORION: A Holistic End-to-End Autonomous Driving Framework by Vision-Language Instructed Action Generation	Mar 25, 2025	Action GenerationAutonomous Driving	—Unverified
Decontextualization: Making Sentences Stand-Alone	Feb 9, 2021	document understandingQuestion Answering	—Unverified
Orthogonality of Syntax and Semantics within Distributional Spaces	Jul 1, 2015	Machine TranslationQuestion Answering	—Unverified
KG-FiD: Infusing Knowledge Graph in Fusion-in-Decoder for Open-Domain Question Answering	Oct 8, 2021	Answer GenerationDecoder	—Unverified
Decomposing Consumer Health Questions	Jun 1, 2014	Question Answering	—Unverified
OSU\_CHGCG at SemEval-2016 Task 9 : Chinese Semantic Dependency Parsing with Generalized Categorial Grammar	Jun 1, 2016	Dependency ParsingQuestion Answering	—Unverified
KGConv, a Conversational Corpus grounded in Wikidata	Aug 29, 2023	Knowledge GraphsQuestion Answering	—Unverified
KG^2: Learning to Reason Science Exam Questions with Contextual Knowledge Graph Embeddings	May 31, 2018	AI2 Reasoning ChallengeARC	—Unverified
Out of the Box: Reasoning with Graph Convolution Nets for Factual Visual Question Answering	Nov 1, 2018	Factual Visual Question AnsweringGeneral Knowledge	—Unverified
Automatic Spanish Translation of SQuAD Dataset for Multi-lingual Question Answering	May 1, 2020	Question AnsweringTAR	—Unverified
An Empirical Study of Batch Normalization and Group Normalization in Conditional Computation	Jul 31, 2019	Conditional Image GenerationFew-Shot Learning	—Unverified
Overcoming Language Bias in Remote Sensing Visual Question Answering via Adversarial Training	Jun 1, 2023	Question AnsweringVisual Question Answering	—Unverified
Overcoming Language Priors for Visual Question Answering Based on Knowledge Distillation	Jan 10, 2025	Knowledge DistillationQuestion Answering	—Unverified
Advancing Medical Imaging with Language Models: A Journey from N-grams to ChatGPT	Apr 11, 2023	DiagnosticImage Captioning	—Unverified
KEYword based Sampling (KEYS) for Large Language Models	May 30, 2023	Knowledge DistillationLanguage Modeling	—Unverified
Decoding on Graphs: Faithful and Sound Reasoning on Knowledge Graphs through Generation of Well-Formed Chains	Oct 24, 2024	Knowledge GraphsQuestion Answering	—Unverified
Keyword-Aware Relative Spatio-Temporal Graph Networks for Video Question Answering	Jul 25, 2023	graph constructionQuestion Answering	—Unverified
Overfitting at SemEval-2016 Task 3: Detecting Semantically Similar Questions in Community Question Answering Forums with Word Embeddings	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
Overinformative Question Answering by Humans and Machines	May 11, 2023	Question Answering	—Unverified
KeyVideoLLM: Towards Large-scale Video Keyframe Selection	Jul 3, 2024	Data CompressionManagement	—Unverified

Show:10 25 50

← PrevPage 289 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified