Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5176–5200 of 10817 papers

Title	Date	Tasks	Status
Automatic Question-Answer Generation for Long-Tail Knowledge	Mar 3, 2024	Answer GenerationKnowledge Graphs	—Unverified
Attention-Based Convolutional Neural Network for Machine Comprehension	Feb 13, 2016	Feature EngineeringNatural Language Inference	—Unverified
Accurate Unbounded Dependency Recovery using Generalized Categorial Grammars	Dec 1, 2012	Question AnsweringSemantic Composition	—Unverified
KeLP at SemEval-2017 Task 3: Learning Pairwise Patterns in Community Question Answering	Aug 1, 2017	Community Question AnsweringQuestion Answering	—Unverified
Kencorpus: A Kenyan Language Corpus of Swahili, Dholuo and Luhya for Natural Language Processing Tasks	Aug 25, 2022	Machine TranslationPart-Of-Speech Tagging	—Unverified
KenSwQuAD -- A Question Answering Dataset for Swahili Low Resource Language	May 4, 2022	BIG-bench Machine LearningQuestion Answering	—Unverified
Deceptive Answer Prediction with User Preference Graph	Aug 1, 2013	Answer SelectionCommunity Question Answering	—Unverified
Large-Scale Acquisition of Entailment Pattern Pairs by Exploiting Transitivity	Sep 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
KERMIT: Generative Insertion-Based Modeling for Sequences	Jun 4, 2019	Machine TranslationQuestion Answering	—Unverified
Kernel Pooling for Convolutional Neural Networks	Jul 1, 2017	Face RecognitionFine-Grained Visual Categorization	—Unverified
Decision Knowledge Graphs: Construction of and Usage in Question Answering for Clinical Practice Guidelines	Aug 6, 2023	Knowledge GraphsQuestion Answering	—Unverified
Large-Scale Paraphrasing for Natural Language Understanding	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Learning Answer-Entailing Structures for Machine Comprehension	Jul 1, 2015	Multi-Task LearningQuestion Answering	—Unverified
Improving Event Coreference Resolution by Modeling Correlations between Event Coreference Chains and Document Topic Structures	Jul 1, 2018	coreference-resolutionCoreference Resolution	—Unverified
Improving Differentiable Neural Computers Through Memory Masking, De-allocation, and Link Distribution Sharpness Control	May 1, 2019	Question Answering	—Unverified
Keynote: Graph-based Approaches for Spoken Language Understanding	Sep 1, 2015	Knowledge GraphsQuestion Answering	—Unverified
Keyphrase Extraction in Scientific Articles: A Supervised Approach	Dec 1, 2012	ArticlesDocument Classification	—Unverified
Keyphrases Extraction from User-Generated Contents in Healthcare Domain Using Long Short-Term Memory Networks	Jul 1, 2018	Question AnsweringText Classification	—Unverified
An Empirically-grounded tool for Automatic Prompt Linting and Repair: A Case Study on Bias, Vulnerability, and Optimization in Developer Prompts	Jan 21, 2025	Question AnsweringSentiment Analysis	—Unverified
KeyVideoLLM: Towards Large-scale Video Keyframe Selection	Jul 3, 2024	Data CompressionManagement	—Unverified
Keyword-Aware Relative Spatio-Temporal Graph Networks for Video Question Answering	Jul 25, 2023	graph constructionQuestion Answering	—Unverified
KEYword based Sampling (KEYS) for Large Language Models	May 30, 2023	Knowledge DistillationLanguage Modeling	—Unverified
Large Language Models for Social Networks: Applications, Challenges, and Solutions	Jan 4, 2024	Question Answering	—Unverified
KG^2: Learning to Reason Science Exam Questions with Contextual Knowledge Graph Embeddings	May 31, 2018	AI2 Reasoning ChallengeARC	—Unverified
Improving Data Augmentation in Low-resource Question Answering with Active Learning in Multiple Stages	Jan 16, 2022	Active LearningAnswer Generation	—Unverified

Show:10 25 50

← PrevPage 208 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified