Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7526–7550 of 10817 papers

Title	Date	Tasks	Status
Face-to-Face Contrastive Learning for Social Intelligence Question-Answering	Jul 29, 2022	Contrastive LearningGraph Neural Network	—Unverified
Pretrained Transformers for Simple Question Answering	May 2, 2019	Knowledge GraphsPrediction	—Unverified
Pretraining and Updates of Domain-Specific LLM: A Case Study in the Japanese Business Domain	Apr 12, 2024	Continual PretrainingGeneral Knowledge	—Unverified
FACTIFY3M: A Benchmark for Multimodal Fact Verification with Explainability through 5W Question-Answering	May 22, 2023	Fact VerificationQuestion Answering	—Unverified
Pre-training, Fine-tuning and Re-ranking: A Three-Stage Framework for Legal Question Answering	Dec 27, 2024	Question AnsweringRepresentation Learning	—Unverified
Pre-training for Information Retrieval: Are Hyperlinks Fully Explored?	Sep 14, 2022	Information RetrievalQuestion Answering	—Unverified
Pre-training image-language transformers for open-vocabulary tasks	Sep 9, 2022	Question AnsweringVisual Entailment	—Unverified
Pre-training Language Models for Comparative Reasoning	May 23, 2023	Question AnsweringQuestion Generation	—Unverified
Pre-training Language Models with Deterministic Factual Knowledge	Oct 20, 2022	Knowledge ProbingQuestion Answering	—Unverified
Greenback Bears and Fiscal Hawks: Finance is a Jungle and Text Embeddings Must Adapt	Nov 11, 2024	Question Answering	—Unverified
Comprehensive Evaluation for a Large Scale Knowledge Graph Question Answering Service	Jan 28, 2025	Graph Question AnsweringNatural Language Queries	—Unverified
A Strong Lexical Matching Method for the Machine Comprehension Test	Sep 1, 2015	Common Sense ReasoningCoreference Resolution	—Unverified
Pre-training Transformer Models with Sentence-Level Objectives for Answer Sentence Selection	May 20, 2022	Answer SelectionQuestion Answering	—Unverified
Pre-training Universal Language Representation	May 30, 2021	Question AnsweringRepresentation Learning	—Unverified
FactTest: Factuality Testing in Large Language Models with Finite-Sample and Distribution-Free Guarantees	Nov 4, 2024	Multiple-choiceQuestion Answering	—Unverified
Pretrain Knowledge-Aware Language Models	Jan 1, 2021	Knowledge ProbingLanguage Modeling	—Unverified
PreWoMe: Exploiting Presuppositions as Working Memory for Long Form Question Answering	Oct 24, 2023	FormLong Form Question Answering	—Unverified
GreaseLM: Graph REASoning Enhanced Language Models	Sep 29, 2021	Knowledge GraphsMedical Question Answering	—Unverified
Comprehensive Audio Query Handling System with Integrated Expert Models and Contextual Understanding	Dec 5, 2024	Audio GenerationAutomatic Speech Recognition	—Unverified
GRASS: Unified Generation Model for Speech-to-Semantic Tasks	Sep 6, 2023	named-entity-recognitionNamed Entity Recognition	—Unverified
GraspCoT: Integrating Physical Property Reasoning for 6-DoF Grasping under Flexible Language Instructions	Mar 20, 2025	Question Answering	—Unverified
Comprehensive and Practical Evaluation of Retrieval-Augmented Generation Systems for Medical Question Answering	Nov 14, 2024	Medical Question AnsweringMisinformation	—Unverified
Privacy Aware Question-Answering System for Online Mental Health Risk Assessment	Jun 9, 2023	DiagnosticQuestion Answering	—Unverified
Privacy Policy Question Answering Assistant: A Query-Guided Extractive Summarization Approach	Sep 29, 2021	Extractive SummarizationQuestion Answering	—Unverified
A strong baseline for question relevancy ranking	Aug 27, 2018	Community Question AnsweringFeature Engineering	—Unverified

Show:10 25 50

← PrevPage 302 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified