Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7951–8000 of 10817 papers

Title	Date	Tasks	Status
Rank2Tell: A Multimodal Driving Dataset for Joint Importance Ranking and Reasoning	Sep 12, 2023	Autonomous VehiclesQuestion Answering	—Unverified
Font-Agent: Enhancing Font Understanding with Large Language Models	Jan 1, 2025	Font GenerationQuestion Answering	—Unverified
Gpt-4: A Review on Advancements and Opportunities in Natural Language Processing	May 4, 2023	Language ModelingLanguage Modelling	—Unverified
GPT-3 Models are Few-Shot Financial Reasoners	Jul 25, 2023	Financial AnalysisPrompt Engineering	—Unverified
GOVERN: Gradient Orientation Vote Ensemble for Multi-Teacher Reinforced Distillation	May 6, 2024	Knowledge DistillationQuestion Answering	—Unverified
Ranking Automatically Generated Questions Using Common Human Queries	Sep 1, 2016	Question AnsweringText Generation	—Unverified
Complex Question Answering: Unsupervised Learning Approaches and Experiments	Jan 15, 2014	Document SummarizationMulti-Document Summarization	—Unverified
Ranking Facts for Explaining Answers to Elementary Science Questions	Oct 18, 2021	Interpretable Machine LearningLearning-To-Rank	—Unverified
AssistPDA: An Online Video Surveillance Assistant for Video Anomaly Prediction, Detection, and Analysis	Mar 27, 2025	Anomaly DetectionAnomaly Forecasting	—Unverified
Ranking Kernels for Structures and Embeddings: A Hybrid Preference and Classification Model	Sep 1, 2017	Community Question AnsweringGeneral Classification	—Unverified
Ranking LLMs by compression	Jun 20, 2024	coreference-resolutionCoreference Resolution	—Unverified
FoRAG: Factuality-optimized Retrieval Augmented Generation for Web-enhanced Long-form Question Answering	Jun 19, 2024	Answer GenerationForm	—Unverified
Assistive Image Annotation Systems with Deep Learning and Natural Language Capabilities: A Review	Jun 28, 2024	Active LearningImage Captioning	—Unverified
GoT-CQA: Graph-of-Thought Guided Compositional Reasoning for Chart Question Answering	Sep 4, 2024	Chart Question AnsweringQuestion Answering	—Unverified
Rapid Adaptation of POS Tagging for Domain Specific Uses	Oct 31, 2014	Part-Of-Speech TaggingPOS	—Unverified
Goodwill Hunting: Analyzing and Repurposing Off-the-Shelf Named Entity Linking Systems	Jun 1, 2021	Entity LinkingQuestion Answering	—Unverified
Complex Question Answering on knowledge graphs using machine translation and multi-task learning	Apr 1, 2021	Entity LinkingKnowledge Graphs	—Unverified
Good, Great, Excellent: Global Inference of Semantic Intensities	Jan 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Rationale-Augmented Ensembles in Language Models	Jul 2, 2022	In-Context LearningPrompt Engineering	—Unverified
Forewords	Dec 1, 2017	Emotion RecognitionIntent Classification	—Unverified
Complex QA and language models hybrid architectures, Survey	Feb 17, 2023	Domain AdaptationFairness	—Unverified
Good, Better, Best: Textual Distractors Generation for Multiple-Choice Visual Question Answering via Reinforcement Learning	Oct 21, 2019	Data AugmentationDecision Making	—Unverified
Complex Program Induction for Querying Knowledge Bases in the Absence of Gold Programs	Mar 1, 2019	Natural Language QueriesProgram induction	—Unverified
RAVEN: A Dataset for Relational and Analogical Visual rEasoNing	Mar 7, 2019	Object RecognitionQuestion Answering	—Unverified
GOF at Qur’an QA 2022: Towards an Efficient Question Answering For The Holy Qu’ran In The Arabic Language Using Deep Learning-Based Approach	Jun 1, 2022	Question Answering	—Unverified
Cost-Effective Hallucination Detection for LLMs	Jul 31, 2024	Decision MakingFact Checking	—Unverified
Re2G: Retrieve, Rerank, Generate	Jan 16, 2022	Fact CheckingGPU	—Unverified
Assisting Scene Graph Generation with Self-Supervision	Aug 8, 2020	Graph GenerationImage Captioning	—Unverified
Reactive Multi-Stage Feature Fusion for Multimodal Dialogue Modeling	Aug 14, 2019	Question AnsweringScene-Aware Dialogue	—Unverified
Assessment of Answers: Online Subjective Examination	Dec 1, 2012	Information RetrievalQuestion Answering	—Unverified
Read before Generate! Faithful Long Form Question Answering with Machine Reading	Mar 1, 2022	Answer GenerationForm	—Unverified
Goal-Oriented Semantic Communication for Wireless Visual Question Answering	Nov 3, 2024	Edge-computingQuestion Answering	—Unverified
Complex Factoid Question Answering with a Free-Text Knowledge Graph	Mar 23, 2021	Graph Neural NetworkGraph Question Answering	—Unverified
Goal-Oriented Multi-Task BERT-Based Dialogue State Tracker	Feb 5, 2020	Dialogue State TrackingQuestion Answering	—Unverified
Fortune: Formula-Driven Reinforcement Learning for Symbolic Table Reasoning in Language Models	May 29, 2025	Question AnsweringReinforcement Learning (RL)	—Unverified
Reading Comprehension as Natural Language Inference: A Semantic Analysis	Oct 4, 2020	FormNatural Language Inference	—Unverified
Complete Chess Games Enable LLM Become A Chess Master	Jan 26, 2025	Language ModelingLanguage Modelling	—Unverified
Reading Comprehension using Entity-based Memory Network	Dec 12, 2016	Question AnsweringReading Comprehension	—Unverified
A Dataset for Arabic Textual Entailment	Sep 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving	Jun 9, 2025	Autonomous DrivingImitation Learning	—Unverified
Recognizing Causality in Verb-Noun Pairs via Noun and Verb Semantics	Apr 1, 2014	Named Entity Recognition (NER)Question Answering	—Unverified
Read + Verify: Machine Reading Comprehension with Unanswerable Questions	Aug 17, 2018	Machine Reading ComprehensionQuestion Answering	—Unverified
GNN is a Counter? Revisiting GNN for Question Answering	Oct 7, 2021	Knowledge GraphsQuestion Answering	—Unverified
ReAgent: Reversible Multi-Agent Reasoning for Knowledge-Enhanced Multi-Hop QA	Mar 10, 2025	Multi-hop Question AnsweringQuestion Answering	—Unverified
Foundation Models and Adaptive Feature Selection: A Synergistic Approach to Video Question Answering	Dec 12, 2024	feature selectionLanguage Modeling	—Unverified
RealCQA-V2 : Visual Premise Proving A Manual COT Dataset for Charts	Oct 29, 2024	Chart Question AnsweringQuestion Answering	—Unverified
Assessing Users' Reputation from Syntactic and Semantic Information in Community Question Answering	May 1, 2020	Community Question AnsweringQuestion Answering	—Unverified
Foundation Models for Natural Language Processing -- Pre-trained Language Models Integrating Media	Feb 16, 2023	Question AnsweringStory Generation	—Unverified
GMSA: Enhancing Context Compression via Group Merging and Layer Semantic Alignment	May 18, 2025	Computational EfficiencyQuestion Answering	—Unverified
Complementary Evidence Identification in Open-Domain Question Answering	Mar 22, 2021	DiversityEvidence Selection	—Unverified

Show:10 25 50

← PrevPage 160 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified