Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8101–8125 of 10817 papers

Title	Date	Tasks	Status
Abstract Meaning Representation of Constructions: The More We Include, the Better the Representation	May 1, 2018	Abstract Meaning RepresentationMachine Translation	—Unverified
Reference-free Hallucination Detection for Large Vision-Language Models	Aug 11, 2024	HallucinationQuestion Answering	—Unverified
Representations for Question Answering from Documents with Tables and Text	Jan 26, 2021	Natural QuestionsQuestion Answering	—Unverified
RescueADI: Adaptive Disaster Interpretation in Remote Sensing Images with Autonomous Agents	Oct 17, 2024	Question AnsweringTask Planning	—Unverified
Research Trends for the Interplay between Large Language Models and Knowledge Graphs	Jun 12, 2024	DescriptiveKnowledge Graphs	—Unverified
Assessing The Potential Of Mid-Sized Language Models For Clinical QA	Apr 24, 2024	MedQAQuestion Answering	—Unverified
REFIND: Retrieval-Augmented Factuality Hallucination Detection in Large Language Models	Feb 19, 2025	HallucinationLanguage Modeling	—Unverified
REFINE on Scarce Data: Retrieval Enhancement through Fine-Tuning via Model Fusion of Embedding Models	Oct 16, 2024	Data AugmentationLanguage Modeling	—Unverified
Refining Implicit Argument Annotation for UCCA	May 26, 2020	Coreference ResolutionNatural Language Understanding	—Unverified
GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks	Jun 14, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified
Comparative Analysis of Retrieval Systems in the Real World	May 3, 2024	Information RetrievalQuestion Answering	—Unverified
Generating Question Relevant Captions to Aid Visual Question Answering	Jun 3, 2019	General KnowledgeImage Captioning	—Unverified
GLaM: Efficient Scaling of Language Models with Mixture-of-Experts	Dec 13, 2021	Common Sense ReasoningIn-Context Learning	—Unverified
Giving BERT a Calculator: Finding Operations and Arguments with Reading Comprehension	Aug 31, 2019	MathQuestion Answering	—Unverified
Comparative Analysis of Open-Source Language Models in Summarizing Medical Text Data	May 25, 2024	Question Answering	—Unverified
From Questions to Insightful Answers: Building an Informed Chatbot for University Resources	May 13, 2024	ChatbotLanguage Modeling	—Unverified
Regularizing Attention Networks for Anomaly Detection in Visual Question Answering	Sep 21, 2020	Anomaly DetectionQuestion Answering	—Unverified
Rehearsing Answers to Probable Questions with Perspective-Taking	Sep 27, 2024	Common Sense ReasoningKnowledge Graphs	—Unverified
Comparative Analysis of Neural QA models on SQuAD	Jun 18, 2018	Information RetrievalQuestion Answering	—Unverified
GiVE: Guiding Visual Encoder to Perceive Overlooked Information	Oct 26, 2024	ObjectQuestion Answering	—Unverified
Assessing the performance of Olelo, a real-time biomedical question answering application	Aug 1, 2017	Document SummarizationInformation Retrieval	—Unverified
Reinforced Iterative Knowledge Distillation for Cross-Lingual Named Entity Recognition	Jun 1, 2021	Cross-Lingual NERKnowledge Distillation	—Unverified
Rephrasing visual questions by specifying the entropy of the answer distribution	Apr 10, 2020	Question AnsweringVisual Question Answering	—Unverified
Reinforced Multi-task Approach for Multi-hop Question Generation	Apr 5, 2020	Multi-hop Question AnsweringQuestion Answering	—Unverified
GigaPevt: Multimodal Medical Assistant	Feb 26, 2024	Question Answering	—Unverified

Show:10 25 50

← PrevPage 325 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified