Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3776–3800 of 10817 papers

Title	Date	Tasks	Status
A Compression-Compilation Framework for On-mobile Real-time BERT Applications	May 30, 2021	Question AnsweringText Generation	—Unverified
ChatGPT as a Factual Inconsistency Evaluator for Text Summarization	Mar 27, 2023	Abstractive Text SummarizationNatural Language Inference	—Unverified
HIT&QMUL at SemEval-2022 Task 9: Label-Enclosed Generative Question Answering (LEG-QA)	Jul 1, 2022	Generative Question AnsweringQuestion Answering	—Unverified
Generating Justifications in a Spatial Question-Answering Dialogue System for a Blocks World	Oct 1, 2021	Question Answering	—Unverified
Generating Natural Answers by Incorporating Copying and Retrieving Mechanisms in Sequence-to-Sequence Learning	Jul 1, 2017	DecoderQuestion Answering	—Unverified
Domain-Targeted, High Precision Knowledge Extraction	Jan 1, 2017	Open Information ExtractionQuestion Answering	—Unverified
Domain-Specific Retrieval-Augmented Generation Using Vector Stores, Knowledge Graphs, and Tensor Factorization	Oct 3, 2024	Anomaly DetectionAttribute	—Unverified
Domain-specific Question Answering with Hybrid Search	Dec 4, 2024	Question AnsweringRetrieval	—Unverified
Beyond English: The Impact of Prompt Translation Strategies across Languages and Tasks in Multilingual LLMs	Feb 13, 2025	Abstractive Text Summarizationnamed-entity-recognition	—Unverified
chatClimate: Grounding Conversational AI in Climate Science	Apr 11, 2023	HallucinationQuestion Answering	—Unverified
Annotating Modal Expressions in the Chinese Treebank	Mar 1, 2013	Question AnsweringSentiment Analysis	—Unverified
A Focused Dynamic Attention Model for Visual Question Answering	Apr 6, 2016	Question AnsweringVisual Question Answering	—Unverified
Domain-Sensitive Temporal Tagging By Jannik Str\"otgen, Michael Gertz	Jun 1, 2018	Information RetrievalNamed Entity Recognition (NER)	—Unverified
Domain-robust VQA with diverse datasets and methods but no target labels	Mar 29, 2021	Domain AdaptationObject Recognition	—Unverified
Fantastic Questions and Where to Find Them: FairytaleQA – An Authentic Dataset for Narrative Comprehension	May 1, 2022	BenchmarkingQuestion Answering	—Unverified
FANToM: A Benchmark for Stress-testing Machine Theory of Mind in Interactions	Oct 24, 2023	Question Answering	—Unverified
FAQ-based Question Answering via Knowledge Anchors	Nov 14, 2019	graph constructionKnowledge Graphs	—Unverified
FAQ-based Question Answering via Word Alignment	Jul 9, 2015	Learning-To-RankQuestion Answering	—Unverified
FAQ-Gen: An automated system to generate domain-specific FAQs to aid content comprehension	Feb 8, 2024	Question Answering	—Unverified
FAQ Search using Transformers	Jan 16, 2022	Question Answering	—Unverified
ChatSOS: Vector Database Augmented Generative Question Answering Assistant in Safety Engineering	May 8, 2024	Generative Question AnsweringInformation Retrieval	—Unverified
Domain-Relevant Embeddings for Medical Question Similarity	Oct 9, 2019	Question AnsweringQuestion Similarity	—Unverified
FASIONAD++ : Integrating High-Level Instruction and Information Bottleneck in FAt-Slow fusION Systems for Enhanced Safety in Autonomous Driving with Adaptive Feedback	Mar 11, 2025	Autonomous DrivingQuestion Answering	—Unverified
Domain Mismatch Doesn’t Always Prevent Cross-lingual Transfer Learning	Jun 1, 2022	Bilingual Lexicon InductionCross-Lingual Transfer	—Unverified
Beyond Chains: Bridging Large Language Models and Knowledge Bases in Complex Question Answering	May 20, 2025	Knowledge Base Question AnsweringQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 152 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified