Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6476–6500 of 10817 papers

Title	Date	Tasks	Status
Mongolian Questions Classification Based on Mulit-Head Attention	Oct 1, 2020	ClassificationQuestion Answering	—Unverified
Emulating Human Cognitive Processes for Expert-Level Medical Question-Answering with Large Language Models	Oct 17, 2023	Decision MakingLanguage Modeling	—Unverified
Contextual Evaluation of Large Language Models for Classifying Tropical and Infectious Diseases	Sep 13, 2024	Medical Question AnsweringNavigate	—Unverified
A Survey on Knowledge-Oriented Retrieval-Augmented Generation	Mar 11, 2025	Information RetrievalNatural Language Understanding	—Unverified
How Context Affects Language Models' Factual Predictions	May 10, 2020	Information RetrievalLanguage Modeling	—Unverified
Monolingual Social Media Datasets for Detecting Contradiction and Entailment	May 1, 2016	Natural Language InferenceQuestion Answering	—Unverified
Enabling Multimodal Generation on CLIP via Vision-Language Knowledge Distillation	Mar 12, 2022	Image CaptioningKnowledge Distillation	—Unverified
A Multi-Source Retrieval Question Answering Framework Based on RAG	May 29, 2024	Question AnsweringRAG	—Unverified
How Can Objects Help Video-Language Understanding?	Apr 10, 2025	Image CaptioningObject	—Unverified
Bridging the Gap between Relevance Matching and Semantic Matching for Short Text Similarity Modeling	Nov 1, 2019	Information RetrievalParaphrase Identification	—Unverified
A Survey on Knowledge Graph Embeddings with Literals: Which model links better Literal-ly?	Oct 28, 2019	Entity LinkingKnowledge Graph Embeddings	—Unverified
Accounting for Focus Ambiguity in Visual Questions	Jan 4, 2025	Question AnsweringVisual Question Answering	—Unverified
MoReVQA: Exploring Modular Reasoning Models for Video Question Answering	Apr 9, 2024	EgoSchemaMultiple-choice	—Unverified
Multi-Modal Fusion Transformer for Visual Question Answering in Remote Sensing	Oct 10, 2022	Question AnsweringRepresentation Learning	—Unverified
Morpho-syntactic Lexical Generalization for CCG Semantic Parsing	Oct 1, 2014	Question AnsweringSemantic Parsing	—Unverified
Morpho-Syntactic Study of Errors from Speech Recognition System	May 1, 2014	Named Entity Recognition (NER)POS	—Unverified
A Survey on Graph Neural Networks for Knowledge Graph Completion	Jul 24, 2020	Information RetrievalKnowledge Base Completion	—Unverified
MoRS at SemEval-2017 Task 3: Easy to use SVM in Ranking Tasks	Aug 1, 2017	Community Question AnsweringInformation Retrieval	—Unverified
MORTY: Structured Summarization for Targeted Information Extraction from Scholarly Articles	Dec 11, 2022	ArticlesManagement	—Unverified
HOP, UNION, GENERATE: Explainable Multi-hop Reasoning without Rationale Supervision	May 23, 2023	Multi-hop Question AnsweringQuestion Answering	—Unverified
MOSMOS: Multi-organ segmentation facilitated by medical report supervision	Sep 4, 2024	Contrastive LearningOrgan Segmentation	—Unverified
Motion-Appearance Co-Memory Networks for Video Question Answering	Mar 29, 2018	Question AnsweringVideo Question Answering	—Unverified
HopRetriever: Retrieve Hops over Wikipedia to Answer Complex Questions	Dec 31, 2020	Document EmbeddingOpen-Domain Question Answering	—Unverified
Contextual Code Switching for Machine Translation using Language Models	Dec 20, 2023	Machine TranslationQuestion Answering	—Unverified
A Multi-Resolution Word Embedding for Document Retrieval from Large Unstructured Knowledge Bases	Feb 2, 2019	Information RetrievalOpen-Domain Question Answering	—Unverified

Show:10 25 50

← PrevPage 260 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified