Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9926–9950 of 10817 papers

Title	Date	Tasks	Status
Selectively Answering Visual Questions	Jun 3, 2024	AvgIn-Context Learning	—Unverified
Self-alignment of Large Video Language Models with Refined Regularized Preference Optimization	Apr 16, 2025	HallucinationQuestion Answering	—Unverified
Self-Attentive Constituency Parsing for UCCA-based Semantic Parsing	Oct 1, 2021	Constituency ParsingFew-Shot Learning	—Unverified
Self-Convinced Prompting: Few-Shot Question Answering with Repeated Introspection	Oct 8, 2023	MiscellaneousQuestion Answering	—Unverified
Self-Crowdsourcing Training for Relation Extraction	Jul 1, 2017	Question AnsweringRelation	—Unverified
Self-DC: When to Reason and When to Act? Self Divide-and-Conquer for Compositional Unknown Questions	Feb 21, 2024	Binary ClassificationOpen-Domain Question Answering	—Unverified
Large Language Models are In-context Teachers for Knowledge Reasoning	Nov 12, 2023	In-Context LearningInformation Retrieval	—Unverified
SelfGraphVQA: A Self-Supervised Graph Neural Network for Scene-based Question Answering	Oct 3, 2023	Graph Neural NetworkQuestion Answering	—Unverified
Self-Improvement Programming for Temporal Knowledge Graph Question Answering	Apr 2, 2024	Graph Question AnsweringIn-Context Learning	—Unverified
Self-Knowledge Guided Retrieval Augmentation for Large Language Models	Oct 8, 2023	Question AnsweringRetrieval	—Unverified
Self-Refinement of Language Models from External Proxy Metrics Feedback	Feb 27, 2024	Question AnsweringResponse Generation	—Unverified
Self-Reflective Planning with Knowledge Graphs: Enhancing LLM Reasoning Reliability for Question Answering	May 26, 2025	Knowledge GraphsQuestion Answering	—Unverified
Self-ReS: Self-Reflection in Large Vision-Language Models for Long Video Understanding	Mar 26, 2025	GPUQuestion Answering	—Unverified
Self-Segregating and Coordinated-Segregating Transformer for Focused Deep Multi-Modular Network for Visual Question Answering	Jun 25, 2020	DiversityQuestion Answering	—Unverified
Self-supervised Contrastive Cross-Modality Representation Learning for Spoken Question Answering	Sep 8, 2021	Question AnsweringRepresentation Learning	—Unverified
Self-supervised Dialogue Learning for Spoken Conversational Question Answering	Jun 4, 2021	Conversational Question Answeringcoreference-resolution	—Unverified
Self-supervised Knowledge Triplet Learning for Zero-shot Question Answering	May 1, 2020	Knowledge GraphsQuestion Answering	—Unverified
Self-Supervised learning with cross-modal transformers for emotion recognition	Nov 20, 2020	Emotion RecognitionLanguage Modeling	—Unverified
Self-supervised pre-training and contrastive representation learning for multiple-choice video QA	Sep 17, 2020	Auxiliary LearningContrastive Learning	—Unverified
Self-Supervised Test-Time Learning for Reading Comprehension	Mar 20, 2021	Question AnsweringReading Comprehension	—Unverified
WeaQA: Weak Supervision via Captions for Visual Question Answering	Dec 4, 2020	Question AnsweringVisual Question Answering	—Unverified
Self-Teaching Machines to Read and Comprehend with Large-Scale Multi-Subject Question-Answering Data	Feb 1, 2021	Machine Reading ComprehensionMultiple-choice	—Unverified
Self-Training for Jointly Learning to Ask and Answer Questions	Jun 1, 2018	Data AugmentationQuestion Answering	—Unverified
Self-training improves Recurrent Neural Networks performance for Temporal Relation Extraction	Oct 1, 2018	Feature EngineeringMachine Translation	—Unverified
Self-Training Large Language Models for Improved Visual Program Synthesis With Visual Reinforcement	Apr 6, 2024	Image-text Retrievalobject-detection	—Unverified

Show:10 25 50

← PrevPage 398 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified