Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2111–2120 of 10817 papers

Title	Date	Tasks	Status	Hype
Collab-RAG: Boosting Retrieval-Augmented Generation for Complex Question Answering via White-Box and Black-Box LLM Collaboration	Apr 7, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
Compositional Semantic Parsing on Semi-Structured Tables	Aug 3, 2015	Question AnsweringSemantic Parsing	CodeCode Available	1
DegreEmbed: incorporating entity embedding into logic rule learning for knowledge graph reasoning	Dec 18, 2021	Knowledge GraphsLink Prediction	CodeCode Available	1
EasyTransfer -- A Simple and Scalable Deep Transfer Learning Platform for NLP Applications	Nov 18, 2020	Compiler OptimizationConversational Question Answering	CodeCode Available	1
Delaying Interaction Layers in Transformer-based Encoders for Efficient Open Domain Question Answering	Oct 16, 2020	Information RetrievalManagement	CodeCode Available	1
ECoRAG: Evidentiality-guided Compression for Long Context RAG	Jun 5, 2025	Answer GenerationOpen-Domain Question Answering	CodeCode Available	1
Fine-tuned LLMs Know More, Hallucinate Less with Few-Shot Sequence-to-Sequence Semantic Parsing over Wikidata	May 23, 2023	Knowledge Base Question AnsweringKnowledge Graphs	CodeCode Available	1
Educational Question Generation of Children Storybooks via Question Type Distribution Learning and Event-Centric Summarization	Mar 27, 2022	Question AnsweringQuestion Generation	CodeCode Available	1
A Long Short-Term Memory for AI Applications in Spike-based Neuromorphic Hardware	Jul 8, 2021	Question AnsweringTime Series	CodeCode Available	1
DeFormer: Decomposing Pre-trained Transformers for Faster Question Answering	May 2, 2020	Question Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 212 of 1082Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified