Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3601–3625 of 10817 papers

Title	Date	Tasks	Status
LLM-aided explanations of EDA synthesis errors	Apr 7, 2024	Question AnsweringReading Comprehension	—Unverified
FQuAD2.0: French Question Answering and Learning When You Don’t Know	Jun 1, 2022	ArticlesFQuAD	—Unverified
FQuAD: French Question Answering Dataset	Feb 14, 2020	ArticlesFQuAD	—Unverified
DoT: An efficient Double Transformer for NLP tasks with tables	Jun 1, 2021	Question Answering	—Unverified
Explanation as Question Answering based on Design Knowledge	Dec 16, 2021	AI AgentOpen-Ended Question Answering	—Unverified
Explanation as Question Answering based on a Task Model of the Agent's Design	Jun 8, 2022	AI AgentQuestion Answering	—Unverified
Do Smaller Language Models Answer Contextualised Questions Through Memorisation Or Generalisation?	Nov 21, 2023	Question AnsweringSemantic Similarity	—Unverified
ExplanationLP: Abductive Reasoning for Explainable Science Question Answering	Oct 25, 2020	Answer SelectionARC	—Unverified
Architecture for a Trustworthy Quantum Chatbot	Mar 6, 2025	ChatbotLarge Language Model	—Unverified
Explanations for CommonsenseQA: New Dataset and Models	Aug 1, 2021	Common Sense ReasoningExplanation Generation	—Unverified
Explanation vs Attention: A Two-Player Game to Obtain Attention for VQA	Nov 19, 2019	Question AnsweringVisual Question Answering	—Unverified
CAVL: Learning Contrastive and Adaptive Representations of Vision and Language	Apr 10, 2023	Image RetrievalPhrase Grounding	—Unverified
Annotation and Analysis of Discourse Relations, Temporal Relations and Multi-Layered Situational Relations in Japanese Texts	Dec 1, 2016	ArticlesNatural Language Inference	—Unverified
Explicit Bias Discovery in Visual Question Answering Models	Nov 19, 2018	Question AnsweringVisual Question Answering	—Unverified
Do Sentence Transformers Learn Quasi-Geospatial Concepts from General Text?	Apr 5, 2024	Question AnsweringRecommendation Systems	—Unverified
DOSA: A Dataset of Social Artifacts from Different Indian Geographical Subcultures	Feb 23, 2024	Question AnsweringText Generation	—Unverified
A Concept-Centric Approach to Multi-Modality Learning	Dec 18, 2024	Image-text matchingQuestion Answering	—Unverified
DoReMi: Grounding Language Model by Detecting and Recovering from Plan-Execution Misalignment	Jul 1, 2023	Language ModelingLanguage Modelling	—Unverified
Explicit Reasoning over End-to-End Neural Architectures for Visual Question Answering	Mar 23, 2018	Question AnsweringVisual Question Answering	—Unverified
Beyond Profile: From Surface-Level Facts to Deep Persona Simulation in LLMs	Feb 18, 2025	Generative Question AnsweringMultiple-choice	—Unverified
Exploiting Attention to Reveal Shortcomings in Memory Models	Nov 1, 2018	BIG-bench Machine LearningDecision Making	—Unverified
Exploiting Bilingual Translation for Question Retrieval in Community-Based Question Answering	Dec 1, 2012	Community Question AnsweringMachine Translation	—Unverified
A Framework for Rationale Extraction for Deep QA models	Oct 9, 2021	Explanation GenerationQuestion Answering	—Unverified
Exploiting Hybrid Semantics of Relation Paths for Multi-hop Question Answering Over Knowledge Graphs	Sep 2, 2022	Answer SelectionKnowledge Graphs	—Unverified
DoQA - Accessing Domain-Specific FAQs via Conversational QA	Jul 1, 2020	Conversational Question AnsweringInformation Retrieval	—Unverified

Show:10 25 50

← PrevPage 145 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified