Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2050 of 10817 papers

Title	Date	Tasks	Status	Hype
Towards Continual Knowledge Learning of Language Models	Oct 7, 2021	Continual LearningFact Checking	CodeCode Available	1
Did Aristotle Use a Laptop? A Question Answering Benchmark with Implicit Reasoning Strategies	Jan 6, 2021	Question AnsweringStrategyQA	CodeCode Available	1
Clover: Towards A Unified Video-Language Alignment and Fusion Model	Jul 16, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Towards Fine-grained Causal Reasoning and QA	Apr 15, 2022	Question AnsweringSentence	CodeCode Available	1
DialogLM: Pre-trained Model for Long Dialogue Understanding and Summarization	Sep 6, 2021	abstractive question answeringDenoising	CodeCode Available	1
CLTR: An End-to-End, Transformer-Based System for Cell Level Table Retrieval and Table Question Answering	Jun 8, 2021	Question AnsweringRetrieval	CodeCode Available	1
AmbigQA: Answering Ambiguous Open-domain Questions	Apr 22, 2020	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
CDLM: Cross-Document Language Modeling	Jan 2, 2021	Citation RecommendationCoreference Resolution	CodeCode Available	1
Clues Before Answers: Generation-Enhanced Multiple-Choice QA	Apr 30, 2022	DecoderMultiple-choice	CodeCode Available	1
Differentiable Reasoning on Large Knowledge Bases and Natural Language	Dec 17, 2019	Link PredictionQuestion Answering	CodeCode Available	1
A Simple LLM Framework for Long-Range Video Question-Answering	Dec 28, 2023	EgoSchemaLanguage Modelling	CodeCode Available	1
Towards Question-Answering as an Automatic Metric for Evaluating the Content Quality of a Summary	Oct 1, 2020	Question Answering	CodeCode Available	1
LogicBench: Towards Systematic Evaluation of Logical Reasoning Ability of Large Language Models	Apr 23, 2024	Logical ReasoningQuestion Answering	CodeCode Available	1
Toward Subgraph-Guided Knowledge Graph Question Generation with Graph Neural Networks	Apr 13, 2020	Data AugmentationDecoder	CodeCode Available	1
Discourse Analysis via Questions and Answers: Parsing Dependency Structures of Questions Under Discussion	Oct 12, 2022	Dependency ParsingQuestion Answering	CodeCode Available	1
CrossGET: Cross-Guided Ensemble of Tokens for Accelerating Vision-Language Transformers	May 27, 2023	Image CaptioningImage Retrieval	CodeCode Available	1
Development and bilingual evaluation of Japanese medical large language model within reasonably low computational resources	Sep 18, 2024	GPULanguage Modeling	CodeCode Available	1
SUTD-TrafficQA: A Question Answering Benchmark and an Efficient Network for Video Reasoning over Traffic Events	Mar 29, 2021	Autonomous VehiclesBenchmarking	CodeCode Available	1
Detecting Hate Speech in Multi-modal Memes	Dec 29, 2020	Binary ClassificationHate Speech Detection	CodeCode Available	1
Training Data is More Valuable than You Think: A Simple and Effective Method by Retrieving from Training Data	Mar 16, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Training Language Models to Generate Text with Citations via Fine-grained Rewards	Feb 6, 2024	HallucinationQuestion Answering	CodeCode Available	1
DeVLBert: Learning Deconfounded Visio-Linguistic Representations	Aug 16, 2020	Image RetrievalQuestion Answering	CodeCode Available	1
Detecting and Preventing Hallucinations in Large Vision Language Models	Aug 11, 2023	16kHallucination	CodeCode Available	1
DEXTER: A Benchmark for open-domain Complex Question Answering using LLMs	Jun 24, 2024	Question AnsweringRetrieval	CodeCode Available	1
Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models	Mar 14, 2024	Decoderimage-classification	CodeCode Available	1
Transformers to Learn Hierarchical Contexts in Multiparty Dialogue for Span-based Question Answering	Apr 7, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Dense Passage Retrieval for Open-Domain Question Answering	Apr 10, 2020	Open-Domain Question AnsweringPassage Retrieval	CodeCode Available	1
TRAR: Routing the Attention Spans in Transformer for Visual Question Answering	Jan 1, 2021	Question AnsweringReferring Expression	CodeCode Available	1
Asking Clarification Questions to Handle Ambiguity in Open-Domain QA	May 23, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
TreeHop: Generate and Filter Next Query Embeddings Efficiently for Multi-hop Question Answering	Apr 28, 2025	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
Densely Connected Attention Propagation for Reading Comprehension	Nov 10, 2018	AllOpen-Domain Question Answering	CodeCode Available	1
Describe Anything Model for Visual Question Answering on Text-rich Images	Jul 16, 2025	DescriptiveLanguage Modeling	CodeCode Available	1
Collab-RAG: Boosting Retrieval-Augmented Generation for Complex Question Answering via White-Box and Black-Box LLM Collaboration	Apr 7, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
TroVE: Inducing Verifiable and Efficient Toolboxes for Solving Programmatic Tasks	Jan 23, 2024	MathQuestion Answering	CodeCode Available	1
A Dataset and Baselines for Visual Question Answering on Art	Aug 28, 2020	Question AnsweringQuestion Generation	CodeCode Available	1
Coarse-to-Fine Vision-Language Pre-training with Fusion in the Backbone	Jun 15, 2022	Described Object DetectionImage Captioning	CodeCode Available	1
Asking Questions the Human Way: Scalable Question-Answer Generation from Text Corpus	Jan 27, 2020	Answer GenerationChatbot	CodeCode Available	1
T-SciQ: Teaching Multimodal Chain-of-Thought Reasoning via Mixed Large Language Model Signals for Science Question Answering	May 5, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
CAT-ViL: Co-Attention Gated Vision-Language Embedding for Visual Question Localized-Answering in Robotic Surgery	Jul 11, 2023	Question AnsweringScene Understanding	CodeCode Available	1
COBRA: Contrastive Bi-Modal Representation Algorithm	May 7, 2020	Cross-Modal RetrievalImage Captioning	CodeCode Available	1
TVLT: Textless Vision-Language Transformer	Sep 28, 2022	Automatic Speech Recognition (ASR)Image Retrieval	CodeCode Available	1
TWEAC: Transformer with Extendable QA Agent Classifiers	Apr 14, 2021	Question Answering	CodeCode Available	1
Dense Hierarchical Retrieval for Open-Domain Question Answering	Oct 28, 2021	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
UAlign: Leveraging Uncertainty Estimations for Factuality Alignment on Large Language Models	Dec 16, 2024	Question Answering	CodeCode Available	1
UDA: A Benchmark Suite for Retrieval Augmented Generation in Real-world Document Analysis	Jun 21, 2024	Question AnsweringRAG	CodeCode Available	1
CodeQA: A Question Answering Dataset for Source Code Comprehension	Sep 17, 2021	Machine Reading ComprehensionQuestion Answering	CodeCode Available	1
Designing a Minimal Retrieve-and-Read System for Open-Domain Question Answering	Apr 15, 2021	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Dialog Inpainting: Turning Documents into Dialogs	May 18, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
DegreEmbed: incorporating entity embedding into logic rule learning for knowledge graph reasoning	Dec 18, 2021	Knowledge GraphsLink Prediction	CodeCode Available	1
DeFormer: Decomposing Pre-trained Transformers for Faster Question Answering	May 2, 2020	Question Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 41 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified