Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10301–10325 of 10817 papers

Title	Date	Tasks	Status
Do LLMs Understand Your Translations? Evaluating Paragraph-level MT with Question Answering	Apr 10, 2025	Machine TranslationQuestion Answering	CodeCode Available
A Technical Question Answering System with Transfer Learning	Oct 1, 2020	Question AnsweringTransfer Learning	CodeCode Available
Do LLMs Implicitly Determine the Suitable Text Difficulty for Users?	Feb 22, 2024	Question Answering	CodeCode Available
MedG-KRP: Medical Graph Knowledge Representation Probing	Dec 14, 2024	Multiple-choiceMultiple Choice Question Answering (MCQA)	CodeCode Available
On the Influence of Context Size and Model Choice in Retrieval-Augmented Generation Systems	Feb 20, 2025	Long Form Question AnsweringQuestion Answering	CodeCode Available
Aligning Visual Regions and Textual Concepts for Semantic-Grounded Image Representations	May 15, 2019	Image CaptioningQuestion Answering	CodeCode Available
Prosody Modifications for Question-Answering in Voice-Only Settings	Jun 11, 2018	InformativenessQuestion Answering	CodeCode Available
MedHallTune: An Instruction-Tuning Benchmark for Mitigating Medical Hallucination in Vision-Language Models	Feb 28, 2025	Decision MakingHallucination	CodeCode Available
On the Multilingual Capabilities of Very Large-Scale English Language Models	Aug 30, 2021	Extractive Question-AnsweringFew-Shot Learning	CodeCode Available
Answering Naturally: Factoid to Full length Answer Generation	Nov 1, 2019	Answer GenerationQuestion Answering	CodeCode Available
Medical Adaptation of Large Language and Vision-Language Models: Are We Making Progress?	Nov 6, 2024	Medical Question AnsweringQuestion Answering	CodeCode Available
Protecting multimodal large language models against misleading visualizations	Feb 27, 2025	Language ModelingLanguage Modelling	CodeCode Available
CAR: Conceptualization-Augmented Reasoner for Zero-Shot Commonsense Question Answering	May 24, 2023	Question Answering	CodeCode Available
Medical Large Vision Language Models with Multi-Image Visual Ability	May 25, 2025	Question AnsweringVisual Question Answering (VQA)	CodeCode Available
Medical Question Summarization with Entity-driven Contrastive Learning	Apr 15, 2023	Contrastive LearningMedical Question Answering	CodeCode Available
Medical Question Understanding and Answering with Knowledge Grounding and Semantic Self-Supervision	Sep 30, 2022	Medical Question AnsweringQuestion Answering	CodeCode Available
On the Robustness of Dialogue History Representation in Conversational Question Answering: A Comprehensive Study and a New Prompt-based Method	Jun 29, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available
A Survey on Recent Advances in Named Entity Recognition from Deep Learning models	Oct 25, 2019	Feature EngineeringInformation Retrieval	CodeCode Available
On the Robustness of Question Rewriting Systems to Questions of Varying Hardness	Nov 12, 2023	Conversational Question AnsweringQuestion Answering	CodeCode Available
A Survey on Deep Learning for Named Entity Recognition	Dec 22, 2018	DecoderDeep Learning	CodeCode Available
On the Structural Memory of LLM Agents	Dec 17, 2024	Language ModelingLanguage Modelling	CodeCode Available
Do-GOOD: Towards Distribution Shift Evaluation for Pre-Trained Visual Document Understanding Models	Jun 5, 2023	document understandingQuestion Answering	CodeCode Available
On the Summarization of Consumer Health Questions	Jul 1, 2019	Data AugmentationQuestion Answering	CodeCode Available
MediFact at MEDIQA-CORR 2024: Why AI Needs a Human Touch	Apr 27, 2024	abstractive question answeringFeature Engineering	CodeCode Available
MediFact at MEDIQA-M3G 2024: Medical Question Answering in Dermatology with Multimodal Learning	Apr 27, 2024	Answer GenerationMedical Question Answering	CodeCode Available

Show:10 25 50

← PrevPage 413 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified