Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7001–7025 of 10817 papers

Title	Date	Tasks	Status
Object-Centric Temporal Consistency via Conditional Autoregressive Inductive Biases	Oct 21, 2024	ObjectQuestion Answering	—Unverified
Occam's Gates	Jun 27, 2015	General ClassificationQuestion Answering	—Unverified
OccLLaMA: An Occupancy-Language-Action Generative World Model for Autonomous Driving	Sep 5, 2024	Autonomous DrivingMotion Planning	—Unverified
Knowledge Distillation of Domain-adapted LLMs for Question-Answering in Telecom	Apr 28, 2025	Domain AdaptationKnowledge Distillation	—Unverified
Knowledge Distillation for Improved Accuracy in Spoken Question Answering	Oct 21, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Knowledge Detection by Relevant Question and Image Attributes in Visual Question Answering	Jun 8, 2023	Question AnsweringRetrieval	—Unverified
Deep learning evaluation using deep linguistic processing	Jun 5, 2017	Deep LearningMultimodal Deep Learning	—Unverified
OG-RAG: Ontology-Grounded Retrieval-Augmented Generation For Large Language Models	Dec 12, 2024	Question AnsweringRAG	—Unverified
AviationGPT: A Large Language Model for the Aviation Domain	Nov 29, 2023	Language ModelingLanguage Modelling	—Unverified
oIQa: An Opinion Influence Oriented Question Answering Framework with Applications to Marketing Domain	Sep 1, 2017	ChatbotInformation Retrieval	—Unverified
An Empirical Study on the Generalization Power of Neural Representations Learned via Visual Guessing Games	Jan 31, 2021	Question AnsweringVisual Question Answering	—Unverified
Knowledge Condensation and Reasoning for Knowledge-based VQA	Mar 15, 2024	Question AnsweringReading Comprehension	—Unverified
Olelo: A Question Answering Application for Biomedicine	Jul 1, 2017	Information RetrievalNamed Entity Recognition (NER)	—Unverified
OMCAT: Omni Context Aware Transformer	Oct 15, 2024	Audio-visual Question AnsweringAudio-Visual Question Answering (AVQA)	—Unverified
Knowledge Completion for Generics using Guided Tensor Factorization	Dec 12, 2016	Active LearningGeneral Knowledge	—Unverified
KnowledgeCheckR: Intelligent Techniques for Counteracting Forgetting	Feb 15, 2021	Collaborative FilteringQuestion Answering	—Unverified
Deep Learning Approaches for Improving Question Answering Systems in Hepatocellular Carcinoma Research	Feb 25, 2024	Question Answering	—Unverified
Knowledge Base Relation Detection via Multi-View Matching	Mar 1, 2018	Knowledge Base Question AnsweringQuestion Answering	—Unverified
Deep Learning applications for COVID-19	Jan 11, 2021	Deep LearningEpidemiology	—Unverified
Knowledge Base Question Answering through Recursive Hypergraphs	Apr 1, 2021	Knowledge Base Question AnsweringQuestion Answering	—Unverified
Deep Learning and Continuous Representations for Natural Language Processing	May 1, 2015	Deep LearningInformation Retrieval	—Unverified
AVATAR: Robust Voice Search Engine Leveraging Autoregressive Document Retrieval and Contrastive Learning	Sep 4, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Knowledge Base Question Answering: A Semantic Parsing Perspective	Sep 12, 2022	AttributeKnowledge Base Question Answering	—Unverified
Omni-R1: Do You Really Need Audio to Fine-Tune Your Audio LLM?	May 14, 2025	Audio Question AnsweringQuestion Answering	—Unverified
Deep Fusion LSTMs for Text Semantic Matching	Aug 1, 2016	Machine TranslationQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 281 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified