Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10401–10450 of 10817 papers

Title	Date	Tasks	Status
Temporal Perceiving Video-Language Pre-training	Jan 18, 2023	Action LocalizationContrastive Learning	—Unverified
Temporal Reasoning Transfer from Text to Video	Oct 8, 2024	DiagnosticMME	—Unverified
Temporal Relation Classification Based on Temporal Reasoning	Mar 1, 2013	ClassificationGeneral Classification	—Unverified
Temporal Relation Classification in Persian and English contexts	Sep 1, 2013	ClassificationGeneral Classification	—Unverified
TempQuestions: A Benchmark for Temporal Question Answering	Apr 23, 2018	Question Answering	—Unverified
TempTabQA: Temporal Question Answering for Semi-Structured Tables	Nov 14, 2023	Question Answering	—Unverified
TEQUILA: Temporal Question Answering over Knowledge Bases	Aug 9, 2019	Question Answering	—Unverified
Term-Based Extraction of Medical Information: Pre-Operative Patient Education Use Case	Sep 1, 2019	Question AnsweringRetrieval	—Unverified
TerraQ: Spatiotemporal Question-Answering on Satellite Image Archives	Feb 6, 2025	Earth ObservationQuestion Answering	—Unverified
Testing AI on language comprehension tasks reveals insensitivity to underlying meaning	Feb 23, 2023	Question Answering	—Unverified
Testing the Limits of Unified Sequence to Sequence LLM Pretraining on Diverse Table Data Tasks	Oct 1, 2023	ArticlesQuestion Answering	—Unverified
Test-Time Adaptation for Visual Document Understanding	Jun 15, 2022	document understandingDomain Adaptation	—Unverified
t-Exponential Memory Networks for Question-Answering Machines	Sep 4, 2018	Language ModelingLanguage Modelling	—Unverified
Text2Analysis: A Benchmark of Table Question Answering with Advanced Data Analysis and Unclear Queries	Dec 21, 2023	Question Answering	—Unverified
Text2Insight: Transform natural language text into insights seamlessly using multi-model architecture	Dec 27, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified
Text Analysis Using Deep Neural Networks in Digital Humanities and Information Science	Jul 30, 2023	Domain AdaptationQuestion Answering	—Unverified
Text-Aware Dual Routing Network for Visual Question Answering	Nov 17, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Text-based Question Answering from Information Retrieval and Deep Neural Network Perspectives: A Survey	Feb 16, 2020	Information RetrievalQuestion Answering	—Unverified
Textbook Question Answering with Multi-modal Context Graph Understanding and Self-supervised Open-set Comprehension	Nov 1, 2018	Open Set LearningQuestion Answering	—Unverified
Textbooks Are All You Need II: phi-1.5 technical report	Sep 11, 2023	AllCode Generation	—Unverified
Textbook to triples: Creating knowledge graph in the form of triples from AI TextBook	Nov 20, 2021	Formnamed-entity-recognition	—Unverified
Text Classification for Task-based Source Code Related Questions	Oct 31, 2021	ClassificationQuestion Answering	—Unverified
Text-Conditioned Generative Model of 3D Strand-based Human Hairstyles	Jan 1, 2024	Question AnsweringVisual Question Answering	—Unverified
Text-controlled Motion Mamba: Text-Instructed Temporal Grounding of Human Motion	Apr 17, 2024	MambaMotion Generation	—Unverified
Text Data Augmentation: Towards better detection of spear-phishing emails	Jul 4, 2020	Data AugmentationGeneral Classification	—Unverified
Text Embeddings for Retrieval From a Large Knowledge Base	Oct 24, 2018	Open-Domain Question AnsweringQuestion Answering	—Unverified
TextGenSHAP: Scalable Post-hoc Explanations in Text Generation with Long Documents	Dec 3, 2023	Question AnsweringText Generation	—Unverified
TextGraphs 2019 Shared Task on Multi-Hop Inference for Explanation Regeneration	Nov 1, 2019	Information RetrievalQuestion Answering	—Unverified
Text-Guided Coarse-to-Fine Fusion Network for Robust Remote Sensing Visual Question Answering	Nov 24, 2024	Question AnsweringRelational Reasoning	—Unverified
Text-level Discourse Dependency Parsing	Jun 1, 2014	Dependency ParsingQuestion Answering	—Unverified
Text-level Discourse Parsing with Rich Linguistic Features	Jul 1, 2012	Discourse ParsingInformation Retrieval	—Unverified
TextMatch: Enhancing Image-Text Consistency Through Multimodal Optimization	Dec 24, 2024	In-Context LearningQuestion Answering	—Unverified
DuReader_vis: A Chinese Dataset for Open-domain Document Visual Question Answering	May 1, 2022	document understandingOpen-Domain Question Answering	—Unverified
Neon: News Entity-Interaction Extraction for Enhanced Question Answering	Nov 19, 2024	ArticlesOpen Information Extraction	—Unverified
TextSquare: Scaling up Text-Centric Visual Instruction Tuning	Apr 19, 2024	HallucinationHallucination Evaluation	—Unverified
PatentAgent: Intelligent Agent for Automated Pharmaceutical Patent Analysis	Oct 25, 2024	Drug DiscoveryQuestion Answering	—Unverified
Textual Inference and Meaning Representation in Human Robot Interaction	Nov 1, 2013	Abstract Meaning RepresentationNatural Language Understanding	—Unverified
Textually Enriched Neural Module Networks for Visual Question Answering	Sep 23, 2018	Image CaptioningQuestion Answering	—Unverified
Textual Time Travel: A Temporally Informed Approach to Theory of Mind	Nov 1, 2021	Question Answering	—Unverified
TextVidBench: A Benchmark for Long Video Scene Text Understanding	Jun 5, 2025	Prompt EngineeringQuestion Answering	—Unverified
TFW, DamnGina, Juvie, and Hotsie-Totsie: On the Linguistic and Social Aspects of Internet Slang	Dec 22, 2017	Question Answering	—Unverified
TG-VQA: Ternary Game of Video Question Answering	May 17, 2023	Contrastive LearningQuestion Answering	—Unverified
Thai Sentence Paraphrasing from the Lexical Resource	Nov 1, 2012	Machine TranslationNatural Language Inference	—Unverified
Towards Lifelong Dialogue Agents via Timeline-based Memory Management	Jun 16, 2024	counterfactualManagement	—Unverified
The Answer is at your Fingertips: Improving Passage Retrieval for Web Question Answering with Search Behavior Data	Oct 1, 2013	Passage RetrievalQuestion Answering	—Unverified
The APVA-TURBO Approach To Question Answering in Knowledge Base	Aug 1, 2018	Question AnsweringSemantic Parsing	—Unverified
The ART of LLM Refinement: Ask, Refine, and Trust	Nov 14, 2023	Arithmetic ReasoningGSM8K	—Unverified
The BQ Corpus: A Large-scale Domain-specific Chinese Corpus For Sentence Semantic Equivalence Identification	Oct 1, 2018	ClusteringParaphrase Identification	—Unverified
The Claude 3 Model Family: Opus, Sonnet, Haiku	Mar 4, 2024	1 Image, 2*2 StitchingArithmetic Reasoning	—Unverified
The Color of the Cat is Gray: 1 Million Full-Sentences Visual Question Answering (FSVQA)	Sep 21, 2016	Question AnsweringSentence	—Unverified

Show:10 25 50

← PrevPage 209 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified