Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4101–4125 of 10817 papers

Title	Date	Tasks	Status	Score
12-in-1: Multi-Task Vision and Language Representation Learning	Dec 5, 2019	10-shot image generationImage Retrieval	CodeCode Available	5
GlossGPT: GPT for Word Sense Disambiguation using Few-shot Chain-of-Thought Prompting	Mar 1, 2025	Question AnsweringWord Sense Disambiguation	CodeCode Available	5
GloVe: Global Vectors for Word Representation	Oct 1, 2014	Document ClassificationInformation Retrieval	CodeCode Available	5
Ask the Right Questions: Active Question Reformulation with Reinforcement Learning	May 22, 2017	Information RetrievalQuestion Answering	CodeCode Available	5
Globally Normalized Reader	Sep 8, 2017	Data AugmentationQuestion Answering	CodeCode Available	5
COLD: Causal reasOning in cLosed Daily activities	Nov 29, 2024	Causal InferenceCommonsense Causal Reasoning	CodeCode Available	5
ColBERT Retrieval and Ensemble Response Scoring for Language Model Question Answering	Aug 20, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
GLoMo: Unsupervisedly Learned Relational Graphs as Transferable Representations	Jun 14, 2018	image-classificationImage Classification	CodeCode Available	5
GradBias: Unveiling Word Influence on Bias in Text-to-Image Generative Models	Aug 29, 2024	Bias DetectionFairness	CodeCode Available	5
GETT-QA: Graph Embedding based T2T Transformer for Knowledge Graph Question Answering	Mar 23, 2023	Graph EmbeddingGraph Question Answering	CodeCode Available	5
Give me Some Hard Questions: Synthetic Data Generation for Clinical QA	Dec 5, 2024	Question AnsweringQuestion Generation	CodeCode Available	5
GenKI: Enhancing Open-Domain Question Answering with Knowledge Integration and Controllable Generation in Large Language Models	May 26, 2025	Open-Domain Question AnsweringPassage Retrieval	CodeCode Available	5
Cognitive Weave: Synthesizing Abstracted Knowledge with a Spatio-Temporal Resonance Graph	Jun 9, 2025	Large Language ModelQuestion Answering	CodeCode Available	5
Ask me in your own words: paraphrasing for multitask question answering	Oct 27, 2021	Natural Language UnderstandingParaphrase Generation	CodeCode Available	5
Cognitive Visual Commonsense Reasoning Using Dynamic Working Memory	Jul 4, 2021	Question AnsweringScene Understanding	CodeCode Available	5
Generative Question Refinement with Deep Reinforcement Learning in Retrieval-based QA System	Aug 13, 2019	Deep Reinforcement LearningQuestion Answering	CodeCode Available	5
Cognitive Graph for Multi-Hop Reading Comprehension at Scale	May 14, 2019	Graph Neural NetworkMulti-hop Question Answering	CodeCode Available	5
Gated Orthogonal Recurrent Units: On Learning to Forget	Jun 8, 2017	DenoisingQuestion Answering	CodeCode Available	5
Gated End-to-End Memory Networks	Oct 13, 2016	dialog state trackingQuestion Answering	CodeCode Available	5
Gated Convolutional Bidirectional Attention-based Model for Off-topic Spoken Response Detection	Apr 20, 2020	Machine Reading ComprehensionQuestion Answering	CodeCode Available	5
Gated-Attention Readers for Text Comprehension	Jun 5, 2016	Answer SelectionOpen-Domain Question Answering	CodeCode Available	5
Ask Me Even More: Dynamic Memory Tensor Networks (Extended Model)	Mar 11, 2017	Question AnsweringTensor Networks	CodeCode Available	5
GenerationPrograms: Fine-grained Attribution with Executable Programs	Jun 17, 2025	Document SummarizationLong Form Question Answering	CodeCode Available	5
Generation with Dynamic Vocabulary	Oct 11, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
Game of Sketches: Deep Recurrent Models of Pictionary-style Word Guessing	Jan 29, 2018	Question AnsweringVisual Question Answering	CodeCode Available	5

Show:10 25 50

← PrevPage 165 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified