Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8901–8925 of 10817 papers

Title	Date	Tasks	Status
LLMs to Support a Domain Specific Knowledge Assistant	Feb 6, 2025	ChatbotMultiple-choice	—Unverified
LM Agents for Coordinating Multi-User Information Gathering	Feb 17, 2025	Document SummarizationMulti-Document Summarization	—Unverified
LMME3DHF: Benchmarking and Evaluating Multimodal 3D Human Face Generation with LMMs	Apr 29, 2025	BenchmarkingFace Generation	—Unverified
LMSim : Computing Domain-specific Semantic Word Similarities Using a Language Modeling Approach	Dec 1, 2014	Information RetrievalLanguage Modeling	—Unverified
Local Convergence of Approximate Newton Method for Two Layer Nonlinear Regression	Nov 26, 2023	Question Answeringregression	—Unverified
Localize, Group, and Select: Boosting Text-VQA by Scene Text Modeling	Aug 20, 2021	Data AblationOptical Character Recognition	—Unverified
Localize, Retrieve and Fuse: A Generalized Framework for Free-Form Question Answering over Tables	Sep 20, 2023	FormGraph Neural Network	—Unverified
Localizing AI: Evaluating Open-Weight Language Models for Languages of Baltic States	Jan 7, 2025	Machine TranslationMultiple-choice	—Unverified
Improving QA Generalization by Concurrent Modeling of Multiple Biases	Oct 7, 2020	Extractive Question-AnsweringQuestion Answering	CodeCode Available
Improving Quality of a Post's Set of Answers in Stack Overflow	May 30, 2020	Community Question AnsweringQuestion Answering	CodeCode Available
Can BERT Refrain from Forgetting on Sequential Tasks? A Probing Study	Mar 2, 2023	Extractive Question-AnsweringIncremental Learning	CodeCode Available
MAMA: Meta-optimized Angular Margin Contrastive Framework for Video-Language Representation Learning	Jul 4, 2024	Language ModelingLanguage Modelling	CodeCode Available
Open-Ended Multi-Modal Relational Reasoning for Video Question Answering	Dec 1, 2020	Question AnsweringRelational Reasoning	CodeCode Available
Improving Question Answering over Incomplete KBs with Knowledge-Aware Reader	May 17, 2019	Question Answering	CodeCode Available
Discourse Representation Structure Parsing	Jul 1, 2018	PredictionQuestion Answering	CodeCode Available
Improving Question Answering Performance Using Knowledge Distillation and Active Learning	Sep 26, 2021	Active LearningKnowledge Distillation	CodeCode Available
Open-Ended Visual Question-Answering	Oct 9, 2016	Question AnsweringSentence	CodeCode Available
Improving Question Answering with External Knowledge	Feb 3, 2019	ARCMultiple-choice	CodeCode Available
Revisiting Semantic Representation and Tree Search for Similar Question Retrieval	Aug 22, 2019	AllInformation Retrieval	CodeCode Available
A dataset and exploration of models for understanding video data through fill-in-the-blank question-answering	Nov 23, 2016	DescriptiveLanguage Modeling	CodeCode Available
Discourse Comprehension: A Question Answering Framework to Represent Sentence Connections	Nov 1, 2021	Question AnsweringReading Comprehension	CodeCode Available
ReFusion: Improving Natural Language Understanding with Computation-Efficient Retrieval Representation Fusion	Jan 4, 2024	Natural Language UnderstandingNeural Architecture Search	CodeCode Available
Match-Prompt: Improving Multi-task Generalization Ability for Neural Text Matching via Prompt Learning	Apr 6, 2022	Information RetrievalParaphrase Identification	CodeCode Available
Improving Retrieval Augmented Open-Domain Question-Answering with Vectorized Contexts	Apr 2, 2024	In-Context LearningLanguage Modeling	CodeCode Available
Improving Retrieval-Based Question Answering with Deep Inference Models	Dec 7, 2018	Information RetrievalNatural Language Inference	CodeCode Available

Show:10 25 50

← PrevPage 357 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified