Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7001–7025 of 10817 papers

Title	Date	Tasks	Status
Object-Centric Temporal Consistency via Conditional Autoregressive Inductive Biases	Oct 21, 2024	ObjectQuestion Answering	—Unverified
Occam's Gates	Jun 27, 2015	General ClassificationQuestion Answering	—Unverified
Harnessing Large Vision and Language Models in Agriculture: A Review	Jul 29, 2024	Language ModellingLarge Language Model	—Unverified
Constant Time Graph Neural Networks	Jan 23, 2019	Graph AttentionQuestion Answering	—Unverified
Evaluating the Retrieval Component in LLM-Based Question Answering Systems	Jun 10, 2024	Information RetrievalQuestion Answering	—Unverified
A Survey for Efficient Open Domain Question Answering	Nov 15, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified
Open Information Extraction: A Review of Baseline Techniques, Approaches, and Applications	Oct 18, 2023	Open Information ExtractionQuestion Answering	—Unverified
OG-RAG: Ontology-Grounded Retrieval-Augmented Generation For Large Language Models	Dec 12, 2024	Question AnsweringRAG	—Unverified
Evaluating the Symbol Binding Ability of Large Language Models for Multiple-Choice Questions in Vietnamese General Education	Oct 18, 2023	Multiple-choiceMultiple Choice Question Answering (MCQA)	—Unverified
oIQa: An Opinion Influence Oriented Question Answering Framework with Applications to Marketing Domain	Sep 1, 2017	ChatbotInformation Retrieval	—Unverified
Open Information Extraction on Scientific Text: An Evaluation	Feb 15, 2018	Knowledge Base ConstructionOpen Information Extraction	—Unverified
OpenQA: Hybrid QA System Relying on Structured Knowledge Base as well as Non-structured Data	Dec 31, 2021	Answer SelectionMachine Reading Comprehension	—Unverified
Olelo: A Question Answering Application for Biomedicine	Jul 1, 2017	Information RetrievalNamed Entity Recognition (NER)	—Unverified
OMCAT: Omni Context Aware Transformer	Oct 15, 2024	Audio-visual Question AnsweringAudio-Visual Question Answering (AVQA)	—Unverified
Harnessing AI for efficient analysis of complex policy documents: a case study of Executive Order 14110	Jun 10, 2024	Question Answering	—Unverified
Hard to Cheat: A Turing Test based on Answering Questions about Images	Jan 14, 2015	Question Answering	—Unverified
A Supervised Word Alignment Method based on Cross-Language Span Prediction using Multilingual BERT	Apr 29, 2020	Question AnsweringSentence	—Unverified
Hanfu-Bench: A Multimodal Benchmark on Cross-Temporal Cultural Understanding and Transcreation	Jun 2, 2025	Multiple-choiceQuestion Answering	—Unverified
Evaluation and Enhancement of Semantic Grounding in Large Vision-Language Models	Sep 7, 2023	Question AnsweringVisual Question Answering	—Unverified
Accelerating Manufacturing Scale-Up from Material Discovery Using Agentic Web Navigation and Retrieval-Augmented AI for Process Engineering Schematics Design	Dec 8, 2024	Knowledge GraphsOpen-Domain Question Answering	—Unverified
Open-ended Commonsense Reasoning with Unrestricted Answer Scope	Oct 18, 2023	Question AnsweringRetrieval	—Unverified
Evaluation for Partial Event Coreference	Jun 1, 2014	Coreference ResolutionNatural Language Inference	—Unverified
Handling Multiword Expressions in Causality Estimation	Jan 1, 2017	Common Sense ReasoningQuestion Answering	—Unverified
Omni-R1: Do You Really Need Audio to Fine-Tune Your Audio LLM?	May 14, 2025	Audio Question AnsweringQuestion Answering	—Unverified
Handling Anomalies of Synthetic Questions in Unsupervised Question Answering	Dec 1, 2020	Question Answering	—Unverified

Show:10 25 50

← PrevPage 281 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified