Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10051–10075 of 10817 papers

Title	Date	Tasks	Status
SERC: Syntactic and Semantic Sequence based Event Relation Classification	Nov 3, 2021	ClassificationNatural Language Inference	—Unverified
Serving and Optimizing Machine Learning Workflows on Heterogeneous Infrastructures	May 10, 2022	AutoMLBIG-bench Machine Learning	—Unverified
SetKE: Knowledge Editing for Knowledge Elements Overlap	Apr 29, 2025	Incremental Learningknowledge editing	—Unverified
Set-LLM: A Permutation-Invariant LLM	May 21, 2025	Multiple-choiceQuestion Answering	—Unverified
SGD-QA: Fast Schema-Guided Dialogue State Tracking for Unseen Services	May 17, 2021	Dialogue State TrackingGoal-Oriented Dialogue Systems	—Unverified
SG-FSM: A Self-Guiding Zero-Shot Prompting Paradigm for Multi-Hop Question Answering Based on Finite State Machine	Oct 22, 2024	HallucinationMulti-hop Question Answering	—Unverified
Shai: A large language model for asset management	Dec 21, 2023	Asset ManagementLanguage Modeling	—Unverified
SHAKTI: A 2.5 Billion Parameter Small Language Model Optimized for Edge AI and Low-Resource Environments	Oct 15, 2024	Language ModelingLanguage Modelling	—Unverified
Shallow Convolutional Neural Network for Implicit Discourse Relation Recognition	Sep 1, 2015	Feature EngineeringMachine Translation	—Unverified
Shared Imagination: LLMs Hallucinate Alike	Jul 23, 2024	HallucinationQuestion Answering	—Unverified
Sheffield MultiMT: Using Object Posterior Predictions for Multimodal Machine Translation	Sep 1, 2017	Image CaptioningImage Classification	—Unverified
SHEF-Multimodal: Grounding Machine Translation on Images	Aug 1, 2016	Machine TranslationMultimodal Machine Translation	—Unverified
Shifting the Baseline: Single Modality Performance on Visual Navigation & QA	Nov 1, 2018	Question AnsweringVisual Navigation	—Unverified
SHIKEBLCU at SemEval-2020 Task 2: An External Knowledge-enhanced Matrix for Multilingual and Cross-Lingual Lexical Entailment	Dec 1, 2020	Lexical EntailmentMachine Translation	—Unverified
Shiraz: A Proposed List Wise Approach to Answer Validation	Jun 1, 2015	Community Question AnsweringQuestion Answering	—Unverified
SHMamba: Structured Hyperbolic State Space Model for Audio-Visual Question Answering	Jun 14, 2024	Audio-visual Question AnsweringAudio-Visual Question Answering (AVQA)	—Unverified
Show Why the Answer is Correct! Towards Explainable AI using Compositional Temporal Attention	May 15, 2021	Question AnsweringVisual Question Answering	—Unverified
Siamese Networks for Semantic Pattern Similarity	Dec 17, 2018	Question Answering	—Unverified
GPT-4o as the Gold Standard: A Scalable and General Purpose Approach to Filter Language Model Pretraining Data	Oct 3, 2024	Active LearningLanguage Modeling	—Unverified
Sightation Counts: Leveraging Sighted User Feedback in Building a BLV-aligned Dataset of Diagram Descriptions	Mar 17, 2025	Question Answering	—Unverified
SILC: Improving Vision Language Pretraining with Self-Distillation	Oct 20, 2023	ClassificationContrastive Learning	—Unverified
Silence is Not Consensus: Disrupting Agreement Bias in Multi-Agent LLMs via Catfish Agent for Clinical Decision Making	May 27, 2025	Decision MakingDiagnostic	—Unverified
Silver Retriever: Advancing Neural Passage Retrieval for Polish Question Answering	Sep 15, 2023	Open-Domain Question AnsweringPassage Retrieval	—Unverified
SimBow at SemEval-2017 Task 3: Soft-Cosine Semantic Similarity between Questions for Community Question Answering	Aug 1, 2017	Community Question AnsweringKnowledge Graphs	—Unverified
SimDoc: Topic Sequence Alignment based Document Similarity Framework	Nov 15, 2016	ClusteringQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 403 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified