Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5726–5750 of 10817 papers

Title	Date	Tasks	Status
Leveraging Chain of Thought towards Empathetic Spoken Dialogue without Corresponding Question-Answering Data	Jan 19, 2025	Dialogue GenerationQuestion Answering	—Unverified
DOCENT: Learning Self-Supervised Entity Representations from Large Document Collections	Feb 26, 2021	Knowledge Base CompletionNatural Language Queries	—Unverified
Let's ViCE! Mimicking Human Cognitive Behavior in Image Generation Evaluation	Jul 18, 2023	Image GenerationQuestion Answering	—Unverified
Let's Reason Formally: Natural-Formal Hybrid Reasoning Enhances LLM's Math Capability	May 29, 2025	MathMathematical Reasoning	—Unverified
Let Sense Bags Do Talking: Cross Lingual Word Semantic Similarity for English and Hindi	Dec 1, 2015	Image RetrievalInformation Retrieval	—Unverified
DocChat: An Information Retrieval Approach for Chatbot Engines Using Unstructured Documents	Aug 1, 2016	ChatbotCommunity Question Answering	—Unverified
Let Me Know What to Ask: Interrogative-Word-Aware Question Generation	Oct 30, 2019	Question AnsweringQuestion Generation	—Unverified
DLS@CU: Sentence Similarity from Word Alignment	Aug 1, 2014	Information RetrievalMachine Translation	—Unverified
DLS@CU: Sentence Similarity from Word Alignment and Semantic Vector Composition	Jun 1, 2015	Information RetrievalMachine Translation	—Unverified
Less Is More: Linear Layers on CLIP Features as Powerful VizWiz Model	Jun 10, 2022	Question AnsweringTask 2	—Unverified
DLS@CU-CORE: A Simple Machine Learning Model of Semantic Textual Similarity	Jun 1, 2013	BIG-bench Machine LearningInformation Retrieval	—Unverified
DLS@CU at SemEval-2016 Task 1: Supervised Models of Sentence Similarity	Jun 1, 2016	Machine TranslationNatural Language Inference	—Unverified
BERT for Question Generation	Oct 1, 2019	Language ModelingLanguage Modelling	—Unverified
An Introductory Survey on Attention Mechanisms in NLP Problems	Nov 12, 2018	Dependency ParsingGeneral Classification	—Unverified
Leveraging Logical Rules in Knowledge Editing: A Cherry on the Top	May 24, 2024	knowledge editingMulti-hop Question Answering	—Unverified
A Factoid Question Answering System Using Answer Pattern Matching	Oct 1, 2013	Question Answering	—Unverified
DLIP: Distilling Language-Image Pre-training	Aug 24, 2023	Image CaptioningImage-text Retrieval	—Unverified
BERTERS: Multimodal Representation Learning for Expert Recommendation System with Transformer	Jun 30, 2020	ArticlesCommunity Question Answering	—Unverified
LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning?	Mar 25, 2025	Autonomous NavigationQuestion Answering	—Unverified
Leveraging Pre-trained Models for Failure Analysis Triplets Generation	Oct 31, 2022	Question AnsweringText Summarization	—Unverified
Leveraging Retrieval-Augmented Generation for Persian University Knowledge Retrieval	Nov 9, 2024	Information RetrievalPrompt Engineering	—Unverified
Lego: Learning to Disentangle and Invert Personalized Concepts Beyond Object Appearance in Text-to-Image Diffusion Models	Nov 23, 2023	Language ModellingLarge Language Model	—Unverified
LegalRAG: A Hybrid RAG System for Multilingual Legal Information Retrieval	Apr 19, 2025	Information RetrievalQuestion Answering	—Unverified
DKPro Keyphrases: Flexible and Reusable Keyphrase Extraction Experiments	Jun 1, 2014	Information RetrievalKeyphrase Extraction	—Unverified
BERT-CoQAC: BERT-based Conversational Question Answering in Context	Apr 23, 2021	Conversational Question AnsweringLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 230 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified