Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8151–8200 of 10817 papers

Title	Date	Tasks	Status
Comparative Analysis of Open-Source Language Models in Summarizing Medical Text Data	May 25, 2024	Question Answering	—Unverified
Relation Extraction: Perspective from Convolutional Neural Networks	Jun 1, 2015	ChunkingFeature Engineering	—Unverified
Comparative Analysis of Neural QA models on SQuAD	Jun 18, 2018	Information RetrievalQuestion Answering	—Unverified
Relation-Guided Pre-Training for Open-Domain Question Answering	Sep 21, 2021	Natural QuestionsOpen-Domain Question Answering	—Unverified
GiVE: Guiding Visual Encoder to Perceive Overlooked Information	Oct 26, 2024	ObjectQuestion Answering	—Unverified
Relative Overfitting and Accept-Reject Framework	May 12, 2025	Language ModelingLanguage Modelling	—Unverified
Releasing the CRaQAn (Coreference Resolution in Question-Answering): An open-source dataset and dataset creation methodology using instruction-following models	Nov 27, 2023	Chunkingcoreference-resolution	—Unverified
Assessing the performance of Olelo, a real-time biomedical question answering application	Aug 1, 2017	Document SummarizationInformation Retrieval	—Unverified
Retrieval Enhanced Data Augmentation for Question Answering on Privacy Policies	Jan 16, 2022	Data AugmentationDiversity	—Unverified
Reliable, Adaptable, and Attributable Language Models with Retrieval	Mar 5, 2024	Question AnsweringRetrieval	—Unverified
Retrieval Enhanced Data Augmentation for Question Answering on Privacy Policies	Apr 19, 2022	Data AugmentationDiversity	—Unverified
RELLY: Inferring Hypernym Relationships Between Relational Phrases	Sep 1, 2015	Open Information ExtractionProbabilistic Programming	—Unverified
GigaPevt: Multimodal Medical Assistant	Feb 26, 2024	Question Answering	—Unverified
ReLoop: "Seeing Twice and Thinking Backwards" via Closed-loop Training to Mitigate Hallucinations in Multimodal understanding	Jul 7, 2025	HallucinationQuestion Answering	—Unverified
Comparative Analysis of CHATGPT and the evolution of language models	Mar 28, 2023	Machine TranslationQuestion Answering	—Unverified
Get Your Model Puzzled: Introducing Crossword-Solving as a New NLP Benchmark	Nov 16, 2021	Natural Language UnderstandingOpen-Domain Question Answering	—Unverified
Legal Question-Answering in the Indian Context: Efficacy, Challenges, and Potential of Modern AI Models	Sep 26, 2023	Natural Language QueriesQuestion Answering	—Unverified
Assessing SRL Frameworks with Automatic Training Data Expansion	Apr 1, 2017	Question AnsweringSemantic Role Labeling	—Unverified
Full-Time Supervision based Bidirectional RNN for Factoid Question Answering	Jun 19, 2016	Question Answering	—Unverified
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified
Get Large Language Models Ready to Speak: A Late-fusion Approach for Speech Generation	Oct 27, 2024	parameter-efficient fine-tuningQuestion Answering	—Unverified
CoCo-BERT: Improving Video-Language Pre-training with Contrastive Cross-modal Matching and Denoising	Dec 14, 2021	Cross-Modal RetrievalDecoder	—Unverified
REM-Net: Recursive Erasure Memory Network for Commonsense Evidence Refinement	Dec 24, 2020	Question AnsweringWorld Knowledge	—Unverified
Remote Sensing Vision-Language Foundation Models without Annotations via Ground Remote Alignment	Dec 12, 2023	image-classificationImage Classification	—Unverified
GermanQuAD and GermanDPR: Improving Non-English Question Answering and Passage Retrieval	Apr 26, 2021	Passage RetrievalQuestion Answering	—Unverified
Compact Tensor Pooling for Visual Question Answering	Jun 20, 2017	Question AnsweringVisual Question Answering	—Unverified
Rephrasing visual questions by specifying the entropy of the answer distribution	Apr 10, 2020	Question AnsweringVisual Question Answering	—Unverified
Functorial Language Games for Question Answering	May 19, 2020	Question Answering	—Unverified
German FinBERT: A German Pre-trained Language Model	Nov 15, 2023	Language ModelingLanguage Modelling	—Unverified
Assessing Robustness to Spurious Correlations in Post-Training Language Models	May 9, 2025	Instruction FollowingMathematical Reasoning	—Unverified
Representation, Learning and Reasoning on Spatial Language for Downstream NLP Tasks	Nov 1, 2020	Common Sense ReasoningQuestion Answering	—Unverified
FuRongWang at SemEval-2017 Task 3: Deep Neural Networks for Selecting Relevant Answers in Community Question Answering	Aug 1, 2017	Answer SelectionCommunity Question Answering	—Unverified
Furthest Reasoning with Plan Assessment: Stable Reasoning Path with Retrieval-Augmented Large Language Models	Sep 22, 2023	Multi-hop Question AnsweringQuestion Answering	—Unverified
Code-Mixed Question Answering Challenge: Crowd-sourcing Data and Techniques	Jul 1, 2018	Question AnsweringSentence	—Unverified
Representations for Question Answering from Documents with Tables and Text	Jan 26, 2021	Natural QuestionsQuestion Answering	—Unverified
Representing Movie Characters in Dialogues	Nov 1, 2019	Question AnsweringRelation Classification	—Unverified
Retrieval Data Augmentation Informed by Downstream Question Answering Performance	May 1, 2022	Data AugmentationQuestion Answering	—Unverified
Retrieving Contextual Information for Long-Form Question Answering using Weak Supervision	Oct 11, 2024	FormLong Form Question Answering	—Unverified
Reusable Slotwise Mechanisms	Feb 21, 2023	Future predictionObject	—Unverified
GeoRSMLLM: A Multimodal Large Language Model for Vision-Language Tasks in Geoscience and Remote Sensing	Mar 16, 2025	Change DetectionImage Captioning	—Unverified
GeoRAG: A Question-Answering Approach from a Geographical Perspective	Apr 2, 2025	AttributeGeographic Question Answering	—Unverified
GeoPix: Multi-Modal Large Language Model for Pixel-level Image Understanding in Remote Sensing	Jan 12, 2025	Image CaptioningLanguage Modeling	—Unverified
Assessing Modality Bias in Video Question Answering Benchmarks with Multimodal Large Language Models	Aug 22, 2024	Question AnsweringVideo Question Answering	—Unverified
A dataset and baselines for sequential open-domain question answering	Oct 1, 2018	Information RetrievalOpen-Domain Question Answering	—Unverified
Geometric Feature Enhanced Knowledge Graph Embedding and Spatial Reasoning	Oct 24, 2024	Graph EmbeddingKnowledge Graph Embedding	—Unverified
Geographic Question Answering: Challenges, Uniqueness, Classification, and Future Directions	May 19, 2021	ClassificationGeographic Question Answering	—Unverified
Community Question Answering Platforms vs. Twitter for Predicting Characteristics of Urban Neighbourhoods	Jan 17, 2017	Community Question AnsweringQuestion Answering	—Unverified
Geode: A Zero-shot Geospatial Question-Answering Agent with Explicit Reasoning and Precise Spatio-Temporal Retrieval	Jun 26, 2024	Question Answering	—Unverified
Evaluating LLMs' Mathematical Reasoning in Financial Document Question Answering	Feb 17, 2024	Arithmetic ReasoningMathematical Reasoning	—Unverified
A Mathematical Abstraction for Balancing the Trade-off Between Creativity and Reality in Large Language Models	Jun 4, 2023	ChatbotQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 164 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified