Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7876–7900 of 10817 papers

Title	Date	Tasks	Status
Question Difficulty Estimation in Community Question Answering Services	Oct 1, 2013	Community Question AnsweringQuestion Answering	—Unverified
First Token Probability Guided RAG for Telecom Question Answering	Jan 11, 2025	Multiple-choiceMultiple Choice Question Answering (MCQA)	—Unverified
Question-Driven Graph Fusion Network For Visual Question Answering	Apr 3, 2022	Graph AttentionObject	—Unverified
GPT4Video: A Unified Multimodal Large Language Model for lnstruction-Followed Understanding and Safety-Aware Generation	Nov 25, 2023	Instruction FollowingLanguage Modeling	—Unverified
FIT-RAG: Black-Box RAG with Factual Information and Token Reduction	Mar 21, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified
GPT-4V Explorations: Mining Autonomous Driving	Jun 24, 2024	Autonomous DrivingDecision Making	—Unverified
Question Generation and Answering for exploring Digital Humanities collections	Jun 1, 2022	Question AnsweringQuestion Generation	—Unverified
GPT4GEO: How a Language Model Sees the World's Geography	May 30, 2023	Disaster ResponseLanguage Modeling	—Unverified
Question Generation for Question Answering	Sep 1, 2017	ChatbotQuestion Answering	—Unverified
Summary-Oriented Question Generation for Informational Queries	Oct 19, 2020	ArticlesNatural Questions	—Unverified
Question-Guided Hybrid Convolution for Visual Question Answering	Aug 8, 2018	Question AnsweringVisual Question Answering	—Unverified
A Stacking Gated Neural Architecture for Implicit Discourse Relation Classification	Nov 1, 2016	Feature EngineeringGeneral Classification	—Unverified
A Causal Approach to Mitigate Modality Preference Bias in Medical Visual Question Answering	May 22, 2025	counterfactualMedical Visual Question Answering	—Unverified
RAVEN: A Dataset for Relational and Analogical Visual rEasoNing	Mar 7, 2019	Object RecognitionQuestion Answering	—Unverified
Question: How do Large Language Models perform on the Question Answering tasks? Answer:	Dec 17, 2024	ArticlesInstruction Following	—Unverified
Gpt-4: A Review on Advancements and Opportunities in Natural Language Processing	May 4, 2023	Language ModelingLanguage Modelling	—Unverified
Question Modifiers in Visual Question Answering	Jun 1, 2022	Natural Language UnderstandingQuestion Answering	—Unverified
GPT-3 Models are Few-Shot Financial Reasoners	Jul 25, 2023	Financial AnalysisPrompt Engineering	—Unverified
Question Relevance in Visual Question Answering	Jul 23, 2018	Question AnsweringVisual Question Answering	—Unverified
GOVERN: Gradient Orientation Vote Ensemble for Multi-Teacher Reinforced Distillation	May 6, 2024	Knowledge DistillationQuestion Answering	—Unverified
Complex Question Answering: Unsupervised Learning Approaches and Experiments	Jan 15, 2014	Document SummarizationMulti-Document Summarization	—Unverified
AssistPDA: An Online Video Surveillance Assistant for Video Anomaly Prediction, Detection, and Analysis	Mar 27, 2025	Anomaly DetectionAnomaly Forecasting	—Unverified
Question Retrieval with Distributed Representations and Participant Reputation in Community Question Answering	Dec 1, 2017	Community Question AnsweringQuestion Answering	—Unverified
Assistive Image Annotation Systems with Deep Learning and Natural Language Capabilities: A Review	Jun 28, 2024	Active LearningImage Captioning	—Unverified
GoT-CQA: Graph-of-Thought Guided Compositional Reasoning for Chart Question Answering	Sep 4, 2024	Chart Question AnsweringQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 316 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified