Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10326–10350 of 10817 papers

Title	Date	Tasks	Status
Does RAG Introduce Unfairness in LLMs? Evaluating Fairness in Retrieval-Augmented Generation Systems	Sep 29, 2024	FairnessOpen-Domain Question Answering	CodeCode Available
Acquiring Common Sense Spatial Knowledge through Implicit Spatial Templates	Nov 18, 2017	Common Sense ReasoningQuestion Answering	CodeCode Available
Does Chain-of-Thought Reasoning Help Mobile GUI Agent? An Empirical Study	Mar 21, 2025	AttributeMathematical Problem-Solving	CodeCode Available
Document Haystacks: Vision-Language Reasoning Over Piles of 1000+ Documents	Nov 23, 2024	Question AnsweringRAG	CodeCode Available
MedLogic-AQA: Enhancing Medical Question Answering with Abstractive Models Focusing on Logical Structures	Oct 20, 2024	Answer GenerationInformativeness	CodeCode Available
DocTabQA: Answering Questions from Long Documents Using Tables	Aug 21, 2024	Question Answering	CodeCode Available
DocMIA: Document-Level Membership Inference Attacks against DocVQA Models	Feb 6, 2025	document understandingInference Attack	CodeCode Available
MedMobile: A mobile-sized language model with expert-level clinical capabilities	Oct 11, 2024	Language ModelingLanguage Modelling	CodeCode Available
D-NET: A Pre-Training and Fine-Tuning Framework for Improving the Generalization of Machine Reading Comprehension	Nov 1, 2019	Machine Reading ComprehensionMulti-Task Learning	CodeCode Available
Answering Diverse Questions via Text Attached with Key Audio-Visual Clues	Mar 11, 2024	Audio-visual Question AnsweringAudio-Visual Question Answering (AVQA)	CodeCode Available
Answering Count Queries with Explanatory Evidence	Apr 11, 2022	Question Answering	CodeCode Available
Med-PMC: Medical Personalized Multi-modal Consultation with a Proactive Ask-First-Observe-Next Paradigm	Aug 16, 2024	Decision MakingMedical Visual Question Answering	CodeCode Available
Med-REFL: Medical Reasoning Enhancement via Self-Corrected Fine-grained Reflection	Jun 11, 2025	Medical Question AnsweringMedQA	CodeCode Available
Proximity QA: Unleashing the Power of Multi-Modal Large Language Models for Spatial Proximity Analysis	Jan 31, 2024	Multi-Task LearningQuestion Answering	CodeCode Available
A Survey of Video Datasets for Grounded Event Understanding	Jun 14, 2024	Common Sense ReasoningEvent Extraction	CodeCode Available
Representation Learning for Answer Selection with LSTM-Based Importance Weighting	Jan 1, 2017	Answer SelectionCommunity Question Answering	CodeCode Available
Reading Between the Lanes: Text VideoQA on the Road	Jul 8, 2023	Question AnsweringScene Text Recognition	CodeCode Available
Pruning Pre-trained Language Models with Principled Importance and Self-regularization	May 21, 2023	Data-to-Text Generationnamed-entity-recognition	CodeCode Available
MedViLaM: A multimodal large language model with advanced generalizability and explainability for medical data understanding and generation	Sep 29, 2024	Language ModelingLanguage Modelling	CodeCode Available
Representation Learning for Text-level Discourse Parsing	Jun 1, 2014	Discourse ParsingQuestion Answering	CodeCode Available
Training Heterogeneous Features in Sequence to Sequence Tasks: Latent Enhanced Multi-filter Seq2Seq Model	May 18, 2021	ClusteringDecoder	CodeCode Available
MeeQA: Natural Questions in Meeting Transcripts	May 15, 2023	Natural QuestionsQuestion Answering	CodeCode Available
PSYCHIC: A Neuro-Symbolic Framework for Knowledge Graph Question-Answering Grounding	Oct 19, 2023	Entity LinkingGraph Question Answering	CodeCode Available
DLP-LoRA: Efficient Task-Specific LoRA Fusion with a Dynamic, Lightweight Plugin for Large Language Models	Oct 2, 2024	Multiple-choiceparameter-efficient fine-tuning	CodeCode Available
Ontology-Guided, Hybrid Prompt Learning for Generalization in Knowledge Graph Question Answering	Feb 6, 2025	Graph Question AnsweringKnowledge Graphs	CodeCode Available

Show:10 25 50

← PrevPage 414 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified