Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5151–5175 of 10817 papers

Title	Date	Tasks	Status
Large Language Models are Null-Shot Learners	Jan 16, 2024	Arithmetic ReasoningBenchmarking	—Unverified
Automatic Keyword Extraction on Twitter	Jul 1, 2015	Information RetrievalKeyword Extraction	—Unverified
K-AID: Enhancing Pre-trained Language Models with Domain Knowledge for Question Answering	Sep 22, 2021	CPUKnowledge Distillation	—Unverified
KALA: Knowledge-Augmented Language Model Adaptation	Nov 16, 2021	Domain AdaptationGeneral Knowledge	—Unverified
Improving Implicit Discourse Relation Recognition Through Feature Set Optimization	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Improving Implicit Discourse Relation Recognition with Discourse-specific Word Embeddings	Jul 1, 2017	General ClassificationMachine Translation	—Unverified
Co-Stack Residual Affinity Networks with Multi-level Attention Refinement for Matching Text Sequences	Oct 6, 2018	Paraphrase IdentificationQuestion Answering	—Unverified
KaLM: Knowledge-aligned Autoregressive Language Modeling via Dual-view Knowledge Graph Contrastive Learning	Dec 6, 2024	Contrastive LearningGraph Question Answering	—Unverified
Improving Generated and Retrieved Knowledge Combination Through Zero-shot Generation	Dec 25, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified
KaPQA: Knowledge-Augmented Product Question-Answering	Jul 22, 2024	Question AnsweringRAG	—Unverified
KARL: Knowledge-Aware Reasoning Memory Modeling with Reinforcement Learning of Vector Space	Dec 16, 2019	DecoderLanguage Modeling	—Unverified
KARPA: A Training-free Method of Adapting Knowledge Graph as References for Large Language Model's Reasoning Path Aggregation	Dec 30, 2024	Decision MakingGraph Question Answering	—Unverified
Attention-Based Methods For Audio Question Answering	May 31, 2023	Audio Question AnsweringBinary Classification	—Unverified
Large Language Model Programs	May 9, 2023	Language ModelingLanguage Modelling	—Unverified
Improving Generalization of Pre-trained Language Models via Stochastic Weight Averaging	Dec 12, 2022	Knowledge DistillationQuestion Answering	—Unverified
CO-Search: COVID-19 Information Retrieval with Semantic Search, Question Answering, and Abstractive Summarization	Jun 17, 2020	Abstractive Text SummarizationInformation Retrieval	—Unverified
Detecting Ongoing Events Using Contextual Word and Sentence Embeddings	Jul 2, 2020	AttributeEvent Detection	—Unverified
Attention-Based Convolutional Neural Network for Machine Comprehension	Feb 13, 2016	Feature EngineeringNatural Language Inference	—Unverified
Accurate Unbounded Dependency Recovery using Generalized Categorial Grammars	Dec 1, 2012	Question AnsweringSemantic Composition	—Unverified
Large Language Models for Multi-Choice Question Classification of Medical Subjects	Mar 21, 2024	Multi-class ClassificationQuestion Answering	—Unverified
Large Scale Generative Multimodal Attribute Extraction for E-commerce Attributes	Jun 1, 2023	AttributeAttribute Extraction	—Unverified
K-Edit: Language Model Editing with Contextual Knowledge Awareness	Feb 15, 2025	Knowledge GraphsLanguage Modeling	—Unverified
Keeping the Questions Conversational: Using Structured Representations to Resolve Dependency in Conversational Question Answering	Apr 14, 2023	Conversational Question AnsweringQuestion Answering	—Unverified
LAVIS: A Library for Language-Vision Intelligence	Sep 15, 2022	BenchmarkingImage Captioning	—Unverified
Improving Event Coreference Resolution by Modeling Correlations between Event Coreference Chains and Document Topic Structures	Jul 1, 2018	coreference-resolutionCoreference Resolution	—Unverified

Show:10 25 50

← PrevPage 207 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified