Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10151–10200 of 10817 papers

Title	Date	Tasks	Status
Structured Video-Language Modeling with Temporal Grouping and Spatial Grounding	Mar 28, 2023	Action LocalizationAction Recognition	—Unverified
SPBERTQA: A Two-Stage Question Answering System Based on Sentence Transformers for Medical Texts	Jun 20, 2022	Question AnsweringSentence	—Unverified
Spectral Graph-Based Method of Multimodal Word Embedding	Aug 1, 2017	Graph EmbeddingImage Retrieval	—Unverified
Speech Act Modeling of Written Asynchronous Conversations with Task-Specific Embeddings and Conditional Structured Models	Aug 1, 2016	Question Answering	—Unverified
SpeechBERT: An Audio-and-text Jointly Learned Language Model for End-to-end Spoken Question Answering	Oct 25, 2019	Language ModelingLanguage Modelling	—Unverified
SpeechDPR: End-to-End Spoken Passage Retrieval for Open-Domain Spoken Question Answering	Jan 24, 2024	Passage RetrievalQuestion Answering	—Unverified
Speech-Enabled Hybrid Multilingual Translation for Mobile Devices	Apr 1, 2014	Question AnsweringTranslation	—Unverified
SpeechGuard: Exploring the Adversarial Robustness of Multimodal Large Language Models	May 14, 2024	Adversarial RobustnessInstruction Following	—Unverified
Speech Retrieval-Augmented Generation without Automatic Speech Recognition	Dec 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speeding Up Question Answering Task of Language Models via Inverted Index	Oct 24, 2022	Question Answering	—Unverified
SPFresh: Incremental In-Place Update for Billion-Scale Vector Search	Oct 18, 2024	Information RetrievalQuestion Answering	—Unverified
Sphere Neural-Networks for Rational Reasoning	Mar 22, 2024	HallucinationLogical Reasoning	—Unverified
sPhinX: Sample Efficient Multilingual Instruction Fine-Tuning Through N-shot Guided Prompting	Jul 13, 2024	Machine TranslationQuestion Answering	—Unverified
Spinning Straw into Gold: Using Free Text to Train Monolingual Alignment Models for Non-factoid Question Answering	May 1, 2015	Discourse ParsingInformation Retrieval	—Unverified
SplatTalk: 3D VQA with Gaussian Splatting	Mar 8, 2025	3DGSQuestion Answering	—Unverified
SplaXBERT: Leveraging Mixed Precision Training and Context Splitting for Question Answering	Dec 7, 2024	Question Answering	—Unverified
Spoken Conversational Search for General Knowledge	Sep 26, 2019	Conversational Question AnsweringConversational Search	—Unverified
SpokenNativQA: Multilingual Everyday Spoken Queries for LLMs	May 25, 2025	BenchmarkingDiversity	—Unverified
Spoken question answering for visual queries	May 29, 2025	Question AnsweringVisual Question Answering (VQA)	—Unverified
Sports Intelligence: Assessing the Sports Understanding Capabilities of Language Models through Question Answering from Text to Video	Jun 21, 2024	BenchmarkingFew-Shot Learning	—Unverified
Spot the Odd Man Out: Exploring the Associative Power of Lexical Resources	Oct 1, 2018	ClusteringNatural Language Inference	—Unverified
SPred: Large-scale Harvesting of Semantic Predicates	Aug 1, 2013	Information RetrievalNatural Language Inference	—Unverified
SQALER: Scaling Question Answering by Decoupling Multi-Hop and Logical Reasoning	Oct 27, 2021	Knowledge GraphsLogical Reasoning	—Unverified
SQUARE: Automatic Question Answering Evaluation using Multiple Positive and Negative References	Sep 21, 2023	Answer SelectionQuestion Answering	—Unverified
SQuARE: Semantics-based Question Answering and Reasoning Engine	Sep 22, 2020	Natural Language UnderstandingQuestion Answering	—Unverified
Squibs: What Is a Paraphrase?	Jan 1, 2013	Machine TranslationNatural Language Inference	—Unverified
SRAG: Structured Retrieval-Augmented Generation for Multi-Entity Question Answering over Wikipedia Graph	Mar 3, 2025	Question AnsweringRAG	—Unverified
sranjans : Semantic Textual Similarity using Maximal Weighted Bipartite Graph Matching	Jul 1, 2012	Graph MatchingNatural Language Inference	—Unverified
SRDF: Extracting Lexical Knowledge Graph for Preserving Sentence Meaning	Dec 1, 2016	Dependency ParsingKnowledge Graphs	—Unverified
SSP: Semantic Space Projection for Knowledge Graph Embedding with Text Descriptions	Apr 17, 2016	Graph EmbeddingKnowledge Graph Embedding	—Unverified
Stable Code Technical Report	Apr 1, 2024	Code CompletionLanguage Modelling	—Unverified
Stacked Latent Attention for Multimodal Reasoning	Jun 1, 2018	Image CaptioningMultimodal Reasoning	—Unverified
Stacking with Auxiliary Features for Visual Question Answering	Jun 1, 2018	Common Sense ReasoningQuestion Answering	—Unverified
StackOverflowVQA: Stack Overflow Visual Question Answering Dataset	May 17, 2024	Question AnsweringSentence	—Unverified
STAMPsy: Towards SpatioTemporal-Aware Mixed-Type Dialogues for Psychological Counseling	Dec 21, 2024	Conversational RecommendationDialogue Generation	—Unverified
STAR: A Benchmark for Situated Reasoning in Real-World Videos	May 15, 2024	DiagnosticLogical Reasoning	—Unverified
Stars at Qur’an QA 2022: Building Automatic Extractive Question Answering Systems for the Holy Qur’an with Transformer Models and Releasing a New Dataset	Jun 1, 2022	Extractive Question-AnsweringInformation Retrieval	—Unverified
Correctness Coverage Evaluation for Medical Multiple-Choice Question Answering Based on the Enhanced Conformal Prediction Framework	Mar 7, 2025	Conformal PredictionMedical Question Answering	—Unverified
Statistical Machine Translation Improves Question Retrieval in Community Question Answering via Matrix Factorization	Aug 1, 2013	Community Question AnsweringMachine Translation	—Unverified
Statistical Script Learning with Recurrent Neural Networks	Nov 1, 2016	Coreference ResolutionQuestion Answering	—Unverified
Statistical Uncertainty Quantification for Aggregate Performance Metrics in Machine Learning Benchmarks	Jan 8, 2025	Question AnsweringUncertainty Quantification	—Unverified
Steering LVLMs via Sparse Autoencoder for Hallucination Mitigation	May 22, 2025	HallucinationImage Captioning	—Unverified
SteLLA: A Structured Grading System Using LLMs with RAG	Jan 15, 2025	Question AnsweringRAG	—Unverified
STEP: Enhancing Video-LLMs' Compositional Reasoning by Spatio-Temporal Graph-guided Self-Training	Nov 29, 2024	Question AnsweringVideo Understanding	—Unverified
Steps are all you need: Rethinking STEM Education with Prompt Engineering	Dec 6, 2024	AllHallucination	—Unverified
Steps to Knowledge Graphs Quality Assessment	Aug 16, 2022	Knowledge GraphsQuestion Answering	—Unverified
STL-CQA: Structure-based Transformers with Localization and Encoding for Chart Question Answering	Nov 1, 2020	Chart Question AnsweringQuestion Answering	—Unverified
STOA-VLP: Spatial-Temporal Modeling of Object and Action for Video-Language Pre-training	Feb 20, 2023	Language ModellingObject	—Unverified
Stochastic Precision Ensemble: Self-Knowledge Distillation for Quantized Deep Neural Networks	Sep 30, 2020	image-classificationImage Classification	—Unverified
Stochastic RAG: End-to-End Retrieval-Augmented Generation through Expected Utility Maximization	May 5, 2024	Fact VerificationOpen-Domain Question Answering	—Unverified

Show:10 25 50

← PrevPage 204 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified