Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9901–9950 of 10817 papers

Title	Date	Tasks	Status
Second Place Solution of WSDM2023 Toloka Visual Question Answering Challenge	Jul 5, 2024	Cross-Modal RetrievalQuestion Answering	—Unverified
Secret-Keeping in Question Answering	Mar 16, 2023	Question Answering	—Unverified
SECURA: Sigmoid-Enhanced CUR Decomposition with Uninterrupted Retention and Low-Rank Adaptation in Large Language Models	Feb 25, 2025	Continual LearningGSM8K	—Unverified
Security and Privacy Challenges of Large Language Models: A Survey	Jan 30, 2024	Data PoisoningQuestion Answering	—Unverified
See and Think: Embodied Agent in Virtual Environment	Nov 26, 2023	MinecraftQuestion Answering	—Unverified
SpatialPIN: Enhancing Spatial Reasoning Capabilities of Vision-Language Models through Prompting and Interacting 3D Priors	Mar 18, 2024	HallucinationMotion Planning	—Unverified
Seeing and Reasoning with Confidence: Supercharging Multimodal LLMs with an Uncertainty-Aware Agentic Framework	Mar 11, 2025	Conformal PredictionMultimodal Reasoning	—Unverified
Seeing Far and Clearly: Mitigating Hallucinations in MLLMs with Attention Causal Decoding	May 22, 2025	Causal InferenceHallucination	—Unverified
Seeing is Deceiving: Exploitation of Visual Pathways in Multi-Modal Language Models	Nov 7, 2024	Adversarial AttackImage Captioning	—Unverified
Seeing is Knowing! Fact-based Visual Question Answering using Knowledge Graph Embeddings	Dec 31, 2020	Common Sense ReasoningKnowledge Graph Embeddings	—Unverified
Seeing More with Less: Human-like Representations in Vision Models	Jan 1, 2025	object-detectionObject Detection	—Unverified
Seeing Through the Fog: A Cost-Effectiveness Analysis of Hallucination Detection Systems	Nov 8, 2024	DiagnosticHallucination	—Unverified
Seek and Solve Reasoning for Table Question Answering	Sep 9, 2024	In-Context LearningQuestion Answering	—Unverified
See or Recall: A Sanity Check for the Role of Vision in Solving Visualization Question Answer Tasks with Multimodal LLMs	Apr 14, 2025	Data VisualizationQuestion Answering	—Unverified
See then Tell: Enhancing Key Information Extraction with Vision Grounding	Sep 29, 2024	Image to textKey Information Extraction	—Unverified
"See the World, Discover Knowledge": A Chinese Factuality Evaluation for Large Vision Language Models	Feb 17, 2025	Object RecognitionQuestion Answering	—Unverified
SegEQA: Video Segmentation Based Visual Attention for Embodied Question Answering	Oct 1, 2019	Embodied Question AnsweringQuestion Answering	—Unverified
Segmentation-guided Attention for Visual Question Answering from Remote Sensing Images	Jul 11, 2024	Question AnsweringSegmentation	—Unverified
Segmentation Guided Attention Networks for Visual Question Answering	Jul 1, 2017	Common Sense ReasoningQuestion Answering	—Unverified
SEGMENT+: Long Text Processing with Short-Context Language Models	Oct 9, 2024	Question Answering	—Unverified
Select2Plan: Training-Free ICL-Based Planning through VQA and Memory Retrieval	Nov 6, 2024	Autonomous NavigationIn-Context Learning	—Unverified
Selecting Contextual Peripheral Information for Answer Presentation: The Need for Pragmatic Models	Oct 1, 2015	Question Answering	—Unverified
Selecting Sentences versus Selecting Tree Constituents for Automatic Question Ranking	Dec 1, 2016	Community Question AnsweringMachine Translation	—Unverified
Selectively Answering Ambiguous Questions	May 24, 2023	Question Answering	—Unverified
Selectively Answering Visual Questions	Jun 3, 2024	AvgIn-Context Learning	—Unverified
Self-alignment of Large Video Language Models with Refined Regularized Preference Optimization	Apr 16, 2025	HallucinationQuestion Answering	—Unverified
Self-Attentive Constituency Parsing for UCCA-based Semantic Parsing	Oct 1, 2021	Constituency ParsingFew-Shot Learning	—Unverified
Self-Convinced Prompting: Few-Shot Question Answering with Repeated Introspection	Oct 8, 2023	MiscellaneousQuestion Answering	—Unverified
Self-Crowdsourcing Training for Relation Extraction	Jul 1, 2017	Question AnsweringRelation	—Unverified
Self-DC: When to Reason and When to Act? Self Divide-and-Conquer for Compositional Unknown Questions	Feb 21, 2024	Binary ClassificationOpen-Domain Question Answering	—Unverified
Large Language Models are In-context Teachers for Knowledge Reasoning	Nov 12, 2023	In-Context LearningInformation Retrieval	—Unverified
SelfGraphVQA: A Self-Supervised Graph Neural Network for Scene-based Question Answering	Oct 3, 2023	Graph Neural NetworkQuestion Answering	—Unverified
Self-Improvement Programming for Temporal Knowledge Graph Question Answering	Apr 2, 2024	Graph Question AnsweringIn-Context Learning	—Unverified
Self-Knowledge Guided Retrieval Augmentation for Large Language Models	Oct 8, 2023	Question AnsweringRetrieval	—Unverified
Self-Refinement of Language Models from External Proxy Metrics Feedback	Feb 27, 2024	Question AnsweringResponse Generation	—Unverified
Self-Reflective Planning with Knowledge Graphs: Enhancing LLM Reasoning Reliability for Question Answering	May 26, 2025	Knowledge GraphsQuestion Answering	—Unverified
Self-ReS: Self-Reflection in Large Vision-Language Models for Long Video Understanding	Mar 26, 2025	GPUQuestion Answering	—Unverified
Self-Segregating and Coordinated-Segregating Transformer for Focused Deep Multi-Modular Network for Visual Question Answering	Jun 25, 2020	DiversityQuestion Answering	—Unverified
Self-supervised Contrastive Cross-Modality Representation Learning for Spoken Question Answering	Sep 8, 2021	Question AnsweringRepresentation Learning	—Unverified
Self-supervised Dialogue Learning for Spoken Conversational Question Answering	Jun 4, 2021	Conversational Question Answeringcoreference-resolution	—Unverified
Self-supervised Knowledge Triplet Learning for Zero-shot Question Answering	May 1, 2020	Knowledge GraphsQuestion Answering	—Unverified
Self-Supervised learning with cross-modal transformers for emotion recognition	Nov 20, 2020	Emotion RecognitionLanguage Modeling	—Unverified
Self-supervised pre-training and contrastive representation learning for multiple-choice video QA	Sep 17, 2020	Auxiliary LearningContrastive Learning	—Unverified
Self-Supervised Test-Time Learning for Reading Comprehension	Mar 20, 2021	Question AnsweringReading Comprehension	—Unverified
WeaQA: Weak Supervision via Captions for Visual Question Answering	Dec 4, 2020	Question AnsweringVisual Question Answering	—Unverified
Self-Teaching Machines to Read and Comprehend with Large-Scale Multi-Subject Question-Answering Data	Feb 1, 2021	Machine Reading ComprehensionMultiple-choice	—Unverified
Self-Training for Jointly Learning to Ask and Answer Questions	Jun 1, 2018	Data AugmentationQuestion Answering	—Unverified
Self-training improves Recurrent Neural Networks performance for Temporal Relation Extraction	Oct 1, 2018	Feature EngineeringMachine Translation	—Unverified
Self-Training Large Language Models for Improved Visual Program Synthesis With Visual Reinforcement	Apr 6, 2024	Image-text Retrievalobject-detection	—Unverified
Self-Training Large Language Models for Tool-Use Without Demonstrations	Feb 9, 2025	GSM8KMathematical Reasoning	—Unverified

Show:10 25 50

← PrevPage 199 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified