Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9801–9850 of 10817 papers

Title	Date	Tasks	Status
Winnowing Knowledge for Multi-choice Question Answering	Nov 1, 2021	Question Answering	—Unverified
WISDOM X, DISAANA and D-SUMM: Large-scale NLP Systems for Analyzing Textual Big Data	Dec 1, 2016	Open-Domain Question AnsweringQuestion Answering	—Unverified
WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models	May 23, 2024	HallucinationModel Editing	—Unverified
WixQA: A Multi-Dataset Benchmark for Enterprise Retrieval-Augmented Generation	May 13, 2025	Question AnsweringRAG	—Unverified
Wizard of Tasks: A Novel Conversational Dataset for Solving Real-World Tasks in Conversational Settings	Oct 1, 2022	abstractive question answeringArticles	—Unverified
WoLF: Wide-scope Large Language Model Framework for CXR Understanding	Mar 19, 2024	AnatomyInstruction Following	—Unverified
Word and Phrase Features in Graph Convolutional Network for Automatic Question Classification	Sep 4, 2024	ClassificationGraph Neural Network	—Unverified
Word Clustering Based on Un-LP Algorithm	Aug 1, 2014	ClusteringDependency Parsing	—Unverified
Word Embedding based Correlation Model for Question/Answer Matching	Nov 15, 2015	Question AnsweringTranslation	—Unverified
Word Embedding-based Text Processing for Comprehensive Summarization and Distinct Information Extraction	Apr 21, 2020	ClusteringCommunity Detection	—Unverified
Word Embeddings as Features for Supervised Coreference Resolution	Sep 1, 2017	coreference-resolutionCoreference Resolution	—Unverified
WordNet---Wikipedia---Wiktionary: Construction of a Three-way Alignment	May 1, 2014	Machine TranslationQuestion Answering	—Unverified
Word-Sequence Entropy: Towards Uncertainty Estimation in Free-Form Medical Question Answering Applications and Beyond	Feb 22, 2024	FormMedical Question Answering	—Unverified
Word Similarity Datasets for Indian Languages: Annotation and Baseline Systems	Apr 1, 2017	Dependency ParsingMachine Translation	—Unverified
Worldly Wise (WoW) - Cross-Lingual Knowledge Fusion for Fact-based Visual Spoken-Question Answering	Jun 1, 2021	Knowledge GraphsQuestion Answering	—Unverified
WorldTree: A Corpus of Explanation Graphs for Elementary Science Questions supporting Multi-Hop Inference	Feb 8, 2018	Question AnsweringWorld Knowledge	—Unverified
WorldTree V2: A Corpus of Science-Domain Structured Explanations and Inference Patterns supporting Multi-Hop Inference	May 1, 2020	Question AnsweringWorld Knowledge	—Unverified
Writing your own book: A method for going from closed to open book QA to improve robustness and performance of smaller LLMs	May 18, 2023	InformativenessQuestion Answering	—Unverified
WuDaoMM: A large-scale Multi-Modal Dataset for Pre-training models	Mar 22, 2022	Image CaptioningImage Generation	—Unverified
XAI-CLASS: Explanation-Enhanced Text Classification with Extremely Weak Supervision	Oct 31, 2023	ClassificationQuestion Answering	—Unverified
XAIQA: Explainer-Based Data Augmentation for Extractive Question Answering	Dec 6, 2023	Data AugmentationExtractive Question-Answering	—Unverified
XC-Cache: Cross-Attending to Cached Context for Efficient LLM Inference	Apr 23, 2024	DecoderIn-Context Learning	—Unverified
X-Eval: Generalizable Multi-aspect Text Evaluation via Augmented Instruction Tuning with Auxiliary Evaluation Aspects	Nov 15, 2023	Dialogue GenerationLanguage Modelling	—Unverified
XF2T: Cross-lingual Fact-to-Text Generation for Low-Resource Languages	Sep 22, 2022	Data-to-Text GenerationDescriptive	—Unverified
xGen-MM-Vid (BLIP-3-Video): You Only Need 32 Tokens to Represent a Video Even in VLMs	Oct 21, 2024	Language ModelingLanguage Modelling	—Unverified
xGQA: Cross-Lingual Visual Question Answering	Oct 16, 2021	Cross-Lingual TransferLanguage Modeling	—Unverified
XLDA: Cross-Lingual Data Augmentation for Natural Language Inference and Question Answering	May 27, 2019	Cross-Lingual Natural Language InferenceData Augmentation	—Unverified
xLiD-Lexica: Cross-lingual Linked Data Lexica	May 1, 2014	Cross-Lingual Entity LinkingEntity Linking	—Unverified
XLMRQA: Open-Domain Question Answering on Vietnamese Wikipedia-based Textual Knowledge Source	Apr 14, 2022	Information RetrievalMachine Reading Comprehension	—Unverified
XLTime: A Cross-Lingual Knowledge Transfer Framework for Zero-Shot Low-Resource Language Temporal Expression Extraction	Nov 16, 2021	Causal InferenceInformation Retrieval	—Unverified
XLTime: A Cross-Lingual Knowledge Transfer Framework for Temporal Expression Extraction	Jan 16, 2022	Causal InferenceInformation Retrieval	—Unverified
xMoCo: Cross Momentum Contrastive Learning for Open-Domain Question Answering	Aug 1, 2021	Contrastive LearningInformation Retrieval	—Unverified
XTE: Explainable Text Entailment	Sep 25, 2020	Machine TranslationQuestion Answering	—Unverified
X-VARS: Introducing Explainability in Football Refereeing with Multi-Modal Large Language Model	Apr 7, 2024	Action RecognitionDecision Making	—Unverified
YA-TA: Towards Personalized Question-Answering Teaching Assistants using Instructor-Student Dual Retrieval-augmented Knowledge Fusion	Aug 31, 2024	Question AnsweringResponse Generation	—Unverified
YESciEval: Robust LLM-as-a-Judge for Scientific Question Answering	May 20, 2025	Question Answering	—Unverified
Yet Another Language Identifier	Apr 1, 2012	Language IdentificationQuestion Answering	—Unverified
yiGou: A Semantic Text Similarity Computing System Based on SVM	Jun 1, 2015	Machine TranslationQuestion Answering	—Unverified
Yin and Yang: Balancing and Answering Binary Visual Questions	Nov 16, 2015	Question AnsweringVisual Question Answering	—Unverified
YNUDLG at IJCNLP-2017 Task 5: A CNN-LSTM Model with Attention for Multi-choice Question Answering in Examinations	Dec 1, 2017	Question Answeringvalid	—Unverified
YNU-HPCC at IJCNLP-2017 Task 4: Attention-based Bi-directional GRU Model for Customer Feedback Analysis Task of English	Dec 1, 2017	ClassificationGeneral Classification	—Unverified
YNU-HPCC at IJCNLP-2017 Task 5: Multi-choice Question Answering in Exams Using an Attention-based LSTM Model	Dec 1, 2017	Information RetrievalQuestion Answering	—Unverified
YNU-HPCC at Semeval-2018 Task 11: Using an Attention-based CNN-LSTM for Machine Comprehension using Commonsense Knowledge	Jun 1, 2018	Question AnsweringReading Comprehension	—Unverified
YNU-HPCC at SemEval-2018 Task 12: The Argument Reasoning Comprehension Task Using a Bi-directional LSTM with Attention Model	Jun 1, 2018	Ensemble LearningQuestion Answering	—Unverified
You Can Do Better! If You Elaborate the Reason When Making Prediction	Mar 27, 2021	Multiple-choiceNatural Language Inference	—Unverified
YouMakeup: A Large-Scale Domain-Specific Multimodal Dataset for Fine-Grained Semantic Comprehension	Nov 1, 2019	Caption GenerationQuestion Answering	—Unverified
You Only Need One Model for Open-domain Question Answering	Dec 14, 2021	Hard AttentionNatural Questions	—Unverified
Your Finetuned Large Language Model is Already a Powerful Out-of-distribution Detector	Apr 7, 2024	Language ModelingLanguage Modelling	—Unverified
ZALM3: Zero-Shot Enhancement of Vision-Language Alignment via In-Context Information in Multi-Turn Multimodal Medical Dialogue	Sep 26, 2024	Medical Visual Question AnsweringQuestion Answering	—Unverified
Zero-shot 3D Question Answering via Voxel-based Dynamic Token Compression	Jan 1, 2025	Question Answering	—Unverified

Show:10 25 50

← PrevPage 197 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified