Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4101–4150 of 10817 papers

Title	Date	Tasks	Status	Score
Grounded Graph Decoding Improves Compositional Generalization in Question Answering	Nov 5, 2021	Question Answering	CodeCode Available	5
Aspect-based Sentiment Analysis in Question Answering Forums	Nov 1, 2021	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available	5
Grounding Answers for Visual Questions Asked by Visually Impaired People	Feb 4, 2022	Question AnsweringVisual Question Answering	CodeCode Available	5
Ask Your Neurons: A Deep Learning Approach to Visual Question Answering	May 9, 2016	Question AnsweringVisual Question Answering	CodeCode Available	5
COLUMBUS: Evaluating COgnitive Lateral Understanding through Multiple-choice reBUSes	Sep 6, 2024	Multiple-choiceQuestion Answering	CodeCode Available	5
GraphextQA: A Benchmark for Evaluating Graph-Enhanced Large Language Models	Oct 12, 2023	Answer GenerationHallucination	CodeCode Available	5
12-in-1: Multi-Task Vision and Language Representation Learning	Dec 5, 2019	10-shot image generationImage Retrieval	CodeCode Available	5
Graph-Based Reasoning over Heterogeneous External Knowledge for Commonsense Question Answering	Sep 9, 2019	Common Sense ReasoningGraph Attention	CodeCode Available	5
GradBias: Unveiling Word Influence on Bias in Text-to-Image Generative Models	Aug 29, 2024	Bias DetectionFairness	CodeCode Available	5
Gotta: Generative Few-shot Question Answering by Prompt-based Cloze Data Augmentation	Jun 7, 2023	Data AugmentationQuestion Answering	CodeCode Available	5
Ask the Right Questions: Active Question Reformulation with Reinforcement Learning	May 22, 2017	Information RetrievalQuestion Answering	CodeCode Available	5
GeneQuery: A General QA-based Framework for Spatial Gene Expression Predictions from Histology Images	Nov 27, 2024	Question Answeringwhole slide images	CodeCode Available	5
Gendered Pronoun Resolution using BERT and an extractive question answering formulation	Jun 9, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	5
COLD: Causal reasOning in cLosed Daily activities	Nov 29, 2024	Causal InferenceCommonsense Causal Reasoning	CodeCode Available	5
Gold: A Global and Local-aware Denoising Framework for Commonsense Knowledge Graph Noise Detection	Oct 18, 2023	DenoisingKnowledge Graphs	CodeCode Available	5
ColBERT Retrieval and Ensemble Response Scoring for Language Model Question Answering	Aug 20, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
Graph Learning in the Era of LLMs: A Survey from the Perspective of Data, Models, and Tasks	Dec 17, 2024	Domain GeneralizationGraph Learning	CodeCode Available	5
GloVe: Global Vectors for Word Representation	Oct 1, 2014	Document ClassificationInformation Retrieval	CodeCode Available	5
GlossGPT: GPT for Word Sense Disambiguation using Few-shot Chain-of-Thought Prompting	Mar 1, 2025	Question AnsweringWord Sense Disambiguation	CodeCode Available	5
Globally Normalized Reader	Sep 8, 2017	Data AugmentationQuestion Answering	CodeCode Available	5
GLoMo: Unsupervisedly Learned Relational Graphs as Transferable Representations	Jun 14, 2018	image-classificationImage Classification	CodeCode Available	5
Cognitive Weave: Synthesizing Abstracted Knowledge with a Spatio-Temporal Resonance Graph	Jun 9, 2025	Large Language ModelQuestion Answering	CodeCode Available	5
Give me Some Hard Questions: Synthetic Data Generation for Clinical QA	Dec 5, 2024	Question AnsweringQuestion Generation	CodeCode Available	5
Ask me in your own words: paraphrasing for multitask question answering	Oct 27, 2021	Natural Language UnderstandingParaphrase Generation	CodeCode Available	5
Cognitive Visual Commonsense Reasoning Using Dynamic Working Memory	Jul 4, 2021	Question AnsweringScene Understanding	CodeCode Available	5
Cognitive Graph for Multi-Hop Reading Comprehension at Scale	May 14, 2019	Graph Neural NetworkMulti-hop Question Answering	CodeCode Available	5
Gated Orthogonal Recurrent Units: On Learning to Forget	Jun 8, 2017	DenoisingQuestion Answering	CodeCode Available	5
Gated End-to-End Memory Networks	Oct 13, 2016	dialog state trackingQuestion Answering	CodeCode Available	5
GenKI: Enhancing Open-Domain Question Answering with Knowledge Integration and Controllable Generation in Large Language Models	May 26, 2025	Open-Domain Question AnsweringPassage Retrieval	CodeCode Available	5
GETT-QA: Graph Embedding based T2T Transformer for Knowledge Graph Question Answering	Mar 23, 2023	Graph EmbeddingGraph Question Answering	CodeCode Available	5
GNN2R: Weakly-Supervised Rationale-Providing Question Answering over Knowledge Graphs	Dec 4, 2023	Explanation GenerationGraph Neural Network	CodeCode Available	5
Gated Convolutional Bidirectional Attention-based Model for Off-topic Spoken Response Detection	Apr 20, 2020	Machine Reading ComprehensionQuestion Answering	CodeCode Available	5
Gated-Attention Readers for Text Comprehension	Jun 5, 2016	Answer SelectionOpen-Domain Question Answering	CodeCode Available	5
General Greedy De-bias Learning	Dec 20, 2021	image-classificationImage Classification	CodeCode Available	5
Ask Me Even More: Dynamic Memory Tensor Networks (Extended Model)	Mar 11, 2017	Question AnsweringTensor Networks	CodeCode Available	5
Generative Question Refinement with Deep Reinforcement Learning in Retrieval-based QA System	Aug 13, 2019	Deep Reinforcement LearningQuestion Answering	CodeCode Available	5
Game of Sketches: Deep Recurrent Models of Pictionary-style Word Guessing	Jan 29, 2018	Question AnsweringVisual Question Answering	CodeCode Available	5
GenerationPrograms: Fine-grained Attribution with Executable Programs	Jun 17, 2025	Document SummarizationLong Form Question Answering	CodeCode Available	5
Generation with Dynamic Vocabulary	Oct 11, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
Generating User-Centred Explanations via Illocutionary Question Answering: From Philosophy to Interfaces	Oct 2, 2021	Disease PredictionExplainable Artificial Intelligence (XAI)	CodeCode Available	5
Generative AI Enhanced Financial Risk Management Information Retrieval	Apr 4, 2025	Information RetrievalManagement	CodeCode Available	5
Generalizing Visual Question Answering from Synthetic to Human-Written Questions via a Chain of QA with a Large Language Model	Jan 12, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
FusionNet: Fusing via Fully-Aware Attention with Application to Machine Comprehension	Nov 16, 2017	Question AnsweringReading Comprehension	CodeCode Available	5
CodeRepoQA: A Large-scale Benchmark for Software Engineering Question Answering	Dec 19, 2024	Question Answering	CodeCode Available	5
Generating Context-Aware Natural Answers for Questions in 3D Scenes	Oct 30, 2023	Question AnsweringSentence	CodeCode Available	5
Generating Biomedical Question Answering Corpora from Q&A forums	Feb 6, 2020	ArticlesQuestion Answering	CodeCode Available	5
Faithful Embeddings for Knowledge Base Queries	Apr 7, 2020	Question Answering	CodeCode Available	5
Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering	Dec 16, 2019	Dialogue GenerationKnowledge Base Question Answering	CodeCode Available	5
Knowledge Base Question Answering for Space Debris Queries	May 31, 2023	Knowledge Base Question AnsweringNatural Language Queries	CodeCode Available	5
Fusing Bidirectional Chains of Thought and Reward Mechanisms A Method for Enhancing Question-Answering Capabilities of Large Language Models for Chinese Intangible Cultural Heritage	May 13, 2025	Knowledge DistillationLarge Language Model	—Unverified	0

Show:10 25 50

← PrevPage 83 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified