Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9451–9500 of 10817 papers

Title	Date	Tasks	Status
Universal Text Representation from BERT: An Empirical Study	Oct 17, 2019	Learning-To-RankNatural Language Inference	—Unverified
University Entrance Examinations as a Benchmark Resource for NLP-based Problem Solving	Oct 1, 2013	Machine TranslationNatural Language Inference	—Unverified
University\_Of\_Sheffield: Two Approaches to Semantic Text Similarity	Jul 1, 2012	Information RetrievalNatural Language Inference	—Unverified
Un jeu de données pour répondre à des questions visuelles à propos d’entités nommées en utilisant des bases de connaissances (ViQuAE, a Dataset for Knowledge-based Visual Question Answering about Named Entities)	Jun 1, 2022	Question AnsweringVisual Question Answering	—Unverified
Unleashing the Potential of Large Language Model: Zero-shot VQA for Flood Disaster Scenario	Dec 4, 2023	Language ModelingLanguage Modelling	—Unverified
Unleashing the Power of LLMs as Multi-Modal Encoders for Text and Graph-Structured Data	Oct 15, 2024	Contrastive LearningData Ablation	—Unverified
Unlocking Memorization in Large Language Models with Dynamic Soft Prompting	Sep 20, 2024	Code GenerationMemorization	—Unverified
Unlocking Structured Thinking in Language Models with Cognitive Prompting	Oct 3, 2024	Arithmetic ReasoningGSM8K	—Unverified
Unlocking the Potential of Multiple BERT Models for Bangla Question Answering in NCTB Textbooks	Dec 24, 2024	Question AnsweringReading Comprehension	—Unverified
Unlocking Video-LLM via Agent-of-Thoughts Distillation	Dec 2, 2024	Language ModelingLanguage Modelling	—Unverified
Unlock the Power of Unlabeled Data in Language Driving Model	Mar 13, 2025	Autonomous DrivingQuestion Answering	—Unverified
Unmasking Deceptive Visuals: Benchmarking Multimodal Large Language Models on Misleading Chart Question Answering	Mar 23, 2025	BenchmarkingChart Question Answering	—Unverified
Unraveling the Dilemma of AI Errors: Exploring the Effectiveness of Human and Machine Explanations for Large Language Models	Apr 11, 2024	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	—Unverified
Unraveling the Truth: Do VLMs really Understand Charts? A Deep Dive into Consistency and Robustness	Jul 15, 2024	Chart Question AnsweringQuestion Answering	—Unverified
Unreasonable Effectiveness of Rule-Based Heuristics in Solving Russian SuperGLUE Tasks	May 3, 2021	Common Sense ReasoningNatural Language Inference	—Unverified
Unseen Entity Handling in Complex Question Answering over Knowledge Base via Language Generation	Nov 1, 2021	Computational EfficiencyDecoder	—Unverified
UnSeenTimeQA: Time-Sensitive Question-Answering Beyond LLMs' Memorization	Jul 3, 2024	MemorizationQuestion Answering	—Unverified
Unshuffling Data for Improved Generalization	Feb 27, 2020	ClusteringData Augmentation	—Unverified
Unshuffling Data for Improved Generalization in Visual Question Answering	Jan 1, 2021	Out-of-Distribution GeneralizationQuestion Answering	—Unverified
Unstructured and structured data: Can we have the best of both worlds with large language models?	Apr 25, 2023	Question Answering	—Unverified
Unsupervised Abbreviation Disambiguation Contextual disambiguation using word embeddings	Apr 1, 2019	Question AnsweringReading Comprehension	—Unverified
Unsupervised Adaptation of Question Answering Systems via Generative Self-training	Nov 1, 2020	Question AnsweringSentence	—Unverified
Unsupervised Domain Adaptation of Contextual Embeddings for Low-Resource Duplicate Question Detection	Nov 6, 2019	Domain AdaptationKnowledge Graphs	—Unverified
Unsupervised Domain Adaptation of Language Models for Reading Comprehension	Nov 25, 2019	Domain AdaptationLanguage Modeling	—Unverified
Unsupervised Domain Adaptation on Question-Answering System with Conversation Data	Sep 1, 2022	Domain AdaptationMachine Reading Comprehension	—Unverified
Unsupervised Evaluation for Question Answering with Transformers	Oct 7, 2020	Question Answering	—Unverified
Unsupervised Event Coreference Resolution	Jun 1, 2014	coreference-resolutionCoreference Resolution	—Unverified
Unsupervised Induction of Cross-Lingual Semantic Relations	Oct 1, 2013	Information RetrievalMachine Translation	—Unverified
Unsupervised Inflection Generation Using Neural Language Modeling	Dec 3, 2019	Language ModelingLanguage Modelling	—Unverified
Unsupervised Keyword Extraction for Full-sentence VQA	Nov 23, 2019	Keyword ExtractionQuestion Answering	—Unverified
Unsupervised multiple-choice question generation for out-of-domain Q\&A fine-tuning	Nov 16, 2021	Multiple-choiceQuestion Answering	—Unverified
Unsupervised multiple-choice question generation for out-of-domain Q&A fine-tuning	May 1, 2022	Multiple-choiceQuestion Answering	—Unverified
Unsupervised multiple choices question answering via universal corpus	Feb 27, 2024	FormKnowledge Graphs	—Unverified
Unsupervised Natural Question Answering with a Small Model	Nov 19, 2019	Language ModelingLanguage Modelling	—Unverified
Unsupervised Open-Domain Question Answering	Aug 31, 2021	Machine Reading ComprehensionOpen-Domain Question Answering	—Unverified
Unsupervised Open-Domain Question Answering with Higher Answerability	Nov 16, 2021	Machine Reading ComprehensionOpen-Domain Question Answering	—Unverified
Unsupervised Pre-training for Biomedical Question Answering	Sep 27, 2020	Question AnsweringRepresentation Learning	—Unverified
Unsupervised Question Answering for Fact-Checking	Oct 16, 2019	Fact CheckingNatural Language Inference	—Unverified
Unsupervised Question Clarity Prediction Through Retrieved Item Coherency	Aug 9, 2022	Conversational Question AnsweringPrediction	—Unverified
Unsupervised Relation Discovery with Sense Disambiguation	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Unsupervised Relation Extraction of In-Domain Data from Focused Crawls	Apr 1, 2014	Question AnsweringRelation	—Unverified
Unsupervised Relation Extraction with General Domain Knowledge	Oct 1, 2013	Information RetrievalQuestion Answering	—Unverified
Unsupervised Solution Post Identification from Discussion Forums	Jun 1, 2014	Question Answering	—Unverified
Unsupervised Techniques for Extracting and Clustering Complex Events in News	Jun 1, 2014	ClusteringMachine Translation	—Unverified
Unsupervised Template Mining for Semantic Category Understanding	Oct 1, 2014	Question Answering	—Unverified
Unsupervised Verb Inference from Nouns Crossing Root Boundary	Aug 1, 2014	Machine TranslationNatural Language Inference	—Unverified
Unveiling Cross Modality Bias in Visual Question Answering: A Causal View with Possible Worlds VQA	May 31, 2023	counterfactualCounterfactual Inference	—Unverified
Unveiling Knowledge Utilization Mechanisms in LLM-based Retrieval-Augmented Generation	May 17, 2025	Open-Domain Question AnsweringQuestion Answering	—Unverified
Unveiling LLM Evaluation Focused on Metrics: Challenges and Solutions	Apr 14, 2024	Question AnsweringText Generation	—Unverified
UofR at SemEval-2016 Task 8: Learning Synchronous Hyperedge Replacement Grammar for AMR Parsing	Jun 1, 2016	AMR ParsingMachine Translation	—Unverified

Show:10 25 50

← PrevPage 190 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified