Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2851–2900 of 10817 papers

Title	Date	Tasks	Status
BRIT: Bidirectional Retrieval over Unified Image-Text Graph	May 24, 2025	Image to textQuestion Answering	—Unverified
Answer ranking in Community Question Answering: a deep learning approach	Oct 16, 2022	AttributeCommunity Question Answering	—Unverified
Bring Remote Sensing Object Detect Into Nature Language Model: Using SFT Method	Mar 11, 2025	Language ModelingLanguage Modelling	—Unverified
Answer Ranking for Product-Related Questions via Multiple Semantic Relations Modeling	Jun 28, 2020	Natural Language InferenceQuestion Answering	—Unverified
A Graph-Guided Reasoning Approach for Open-ended Commonsense Question Answering	Mar 18, 2023	Multiple-choiceQuestion Answering	—Unverified
A Graph-guided Multi-round Retrieval Method for Conversational Open-domain Question Answering	Apr 17, 2021	Conversational Question AnsweringOpen-Domain Question Answering	—Unverified
A Crowdsourcing Approach for Annotating Causal Relation Instances in Wikipedia	Nov 1, 2017	Named Entity Recognition (NER)Question Answering	—Unverified
Exploring and Analyzing Machine Commonsense Benchmarks	Dec 21, 2020	Common Sense ReasoningQuestion Answering	—Unverified
Enhancing Pipeline-Based Conversational Agents with Large Language Models	Sep 7, 2023	intent-classificationIntent Classification	—Unverified
Enhancing Question Answering for Enterprise Knowledge Bases using Large Language Models	Apr 10, 2024	ManagementQuestion Answering	—Unverified
Enhancing Robustness of Retrieval-Augmented Language Models with In-Context Learning	Aug 8, 2024	In-Context LearningMachine Reading Comprehension	—Unverified
Bridging the Training-Inference Gap in LLMs by Leveraging Self-Generated Tokens	Oct 18, 2024	MathQuestion Answering	—Unverified
Answer Presentation in Question Answering over Linked Data using Typed Dependency Subtree Patterns	Dec 1, 2016	Dependency ParsingInformation Retrieval	—Unverified
Bridging the Training-Inference Gap for Dense Phrase Retrieval	Oct 25, 2022	Open-Domain Question AnsweringPassage Retrieval	—Unverified
Bridging the Semantic Gaps: Improving Medical VQA Consistency with LLM-Augmented Question Sets	Apr 16, 2025	DiversityMedical Visual Question Answering	—Unverified
A Graph-Based Approach to String Regeneration	Apr 1, 2014	Language ModellingQuestion Answering	—Unverified
Bridging the Preference Gap between Retrievers and LLMs	Jan 13, 2024	Question AnsweringRAG	—Unverified
Bridging the Language Gap: Knowledge Injected Multilingual Question Answering	Apr 6, 2023	Cross-Lingual TransferExtractive Question-Answering	—Unverified
Answer-Me: Multi-Task Open-Vocabulary Visual Question Answering	May 2, 2022	DecoderImage Captioning	—Unverified
Bridging the Knowledge Gap: Enhancing Question Answering with World and Domain Knowledge	Oct 16, 2019	ArticlesQuestion Answering	—Unverified
AGRaME: Any-Granularity Ranking with Multi-Vector Embeddings	May 23, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified
Abacus: A Cost-Based Optimizer for Semantic Operator Systems	May 20, 2025	Question Answering	—Unverified
Bridging the Gap: Dynamic Learning Strategies for Improving Multilingual Performance in LLMs	May 28, 2024	Question AnsweringRAG	—Unverified
Bridging the Gap: Deciphering Tabular Data Using Large Language Model	Aug 23, 2023	Language ModelingLanguage Modelling	—Unverified
Bridging the Gap between Relevance Matching and Semantic Matching for Short Text Similarity Modeling	Nov 1, 2019	Information RetrievalParaphrase Identification	—Unverified
Answer Interaction in Non-factoid Question Answering Systems	Jan 11, 2019	Information RetrievalQuestion Answering	—Unverified
AGQA: A Benchmark for Compositional Spatio-Temporal Reasoning	Mar 30, 2021	Question AnsweringVideo Question Answering	—Unverified
Bridging the Gap between Language Model and Reading Comprehension: Unsupervised MRC via Self-Supervision	Jul 19, 2021	Language ModelingLanguage Modelling	—Unverified
Bridging the Gap Between Information Seeking and Product Search Systems: Q&A Recommendation for E-commerce	Jul 12, 2024	Question Answering	—Unverified
Answering Yes/No Questions via Question Inversion	Dec 1, 2012	Question Answering	—Unverified
Bridging Technology and Humanities: Evaluating the Impact of Large Language Models on Social Sciences Research with DeepSeek-R1	Mar 20, 2025	Large Language ModelLogical Reasoning	—Unverified
Answering Yes-No Questions by Penalty Scoring in History Subjects of University Entrance Examinations	Dec 1, 2016	Question Answering	—Unverified
AAD-LLM: Neural Attention-Driven Auditory Scene Understanding	Feb 24, 2025	Question AnsweringResponse Generation	—Unverified
Enhancing Multimodal LLM for Detailed and Accurate Video Captioning using Multi-Round Preference Optimization	Oct 9, 2024	Audio captioningLarge Language Model	—Unverified
Bridging Speech and Textual Pre-trained Models with Unsupervised ASR	Nov 6, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bridging Question Answering and Discourse The case of Multi-Sentence Questions	Dec 1, 2020	Community Question AnsweringQuestion Answering	—Unverified
Answering while Summarizing: Multi-task Learning for Multi-hop QA with Evidence Extraction	May 21, 2019	Answer SelectionExtractive Summarization	—Unverified
Answering Visual What-If Questions: From Actions to Predicted Scene Descriptions	Sep 11, 2018	Question AnsweringScene Understanding	—Unverified
Bridging Information-Seeking Human Gaze and Machine Reading Comprehension	Sep 30, 2020	Machine Reading ComprehensionMultiple-choice	—Unverified
AGQA 2.0: An Updated Benchmark for Compositional Spatio-Temporal Reasoning	Apr 12, 2022	Question Answering	—Unverified
Bridging Context Gaps: Leveraging Coreference Resolution for Long Contextual Understanding	Oct 2, 2024	coreference-resolutionCoreference Resolution	—Unverified
Answering Unseen Questions With Smaller Language Models Using Rationale Generation and Dense Retrieval	Aug 9, 2023	ARCLanguage Modelling	—Unverified
A Glimpse in ChatGPT Capabilities and its impact for AI research	May 10, 2023	Question AnsweringText Generation	—Unverified
Bridge to Answer: Structure-aware Graph Interaction Network for Video Question Answering	Apr 29, 2021	Question AnsweringVideo Question Answering	—Unverified
Answering Unanswered Questions through Semantic Reformulations in Spoken QA	May 27, 2023	Question AnsweringSpecificity	—Unverified
A criterion for Artificial General Intelligence: hypothetic-deductive reasoning, tested on ChatGPT	Aug 5, 2023	ChatbotQuestion Answering	—Unverified
Enhancing Multi-Image Question Answering via Submodular Subset Selection	May 15, 2025	Question AnsweringRetrieval	—Unverified
Bridge the Gap between Language models and Tabular Understanding	Feb 16, 2023	Contrastive LearningLanguage Modeling	—Unverified
Bridge Damage Cause Estimation Using Multiple Images Based on Visual Question Answering	Feb 18, 2023	Question AnsweringVisual Question Answering	—Unverified
Answering Science Exam Questions Using Query Reformulation with Background Knowledge	Nov 17, 2018	ARCInformation Retrieval	—Unverified

Show:10 25 50

← PrevPage 58 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified