Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7976–8000 of 10817 papers

Title	Date	Tasks	Status
Cost-Effective Hallucination Detection for LLMs	Jul 31, 2024	Decision MakingFact Checking	—Unverified
Re2G: Retrieve, Rerank, Generate	Jan 16, 2022	Fact CheckingGPU	—Unverified
Assisting Scene Graph Generation with Self-Supervision	Aug 8, 2020	Graph GenerationImage Captioning	—Unverified
Reactive Multi-Stage Feature Fusion for Multimodal Dialogue Modeling	Aug 14, 2019	Question AnsweringScene-Aware Dialogue	—Unverified
Assessment of Answers: Online Subjective Examination	Dec 1, 2012	Information RetrievalQuestion Answering	—Unverified
Read before Generate! Faithful Long Form Question Answering with Machine Reading	Mar 1, 2022	Answer GenerationForm	—Unverified
Goal-Oriented Semantic Communication for Wireless Visual Question Answering	Nov 3, 2024	Edge-computingQuestion Answering	—Unverified
Complex Factoid Question Answering with a Free-Text Knowledge Graph	Mar 23, 2021	Graph Neural NetworkGraph Question Answering	—Unverified
Goal-Oriented Multi-Task BERT-Based Dialogue State Tracker	Feb 5, 2020	Dialogue State TrackingQuestion Answering	—Unverified
Fortune: Formula-Driven Reinforcement Learning for Symbolic Table Reasoning in Language Models	May 29, 2025	Question AnsweringReinforcement Learning (RL)	—Unverified
Reading Comprehension as Natural Language Inference: A Semantic Analysis	Oct 4, 2020	FormNatural Language Inference	—Unverified
Complete Chess Games Enable LLM Become A Chess Master	Jan 26, 2025	Language ModelingLanguage Modelling	—Unverified
Reading Comprehension using Entity-based Memory Network	Dec 12, 2016	Question AnsweringReading Comprehension	—Unverified
A Dataset for Arabic Textual Entailment	Sep 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving	Jun 9, 2025	Autonomous DrivingImitation Learning	—Unverified
Recognizing Causality in Verb-Noun Pairs via Noun and Verb Semantics	Apr 1, 2014	Named Entity Recognition (NER)Question Answering	—Unverified
Read + Verify: Machine Reading Comprehension with Unanswerable Questions	Aug 17, 2018	Machine Reading ComprehensionQuestion Answering	—Unverified
GNN is a Counter? Revisiting GNN for Question Answering	Oct 7, 2021	Knowledge GraphsQuestion Answering	—Unverified
ReAgent: Reversible Multi-Agent Reasoning for Knowledge-Enhanced Multi-Hop QA	Mar 10, 2025	Multi-hop Question AnsweringQuestion Answering	—Unverified
Foundation Models and Adaptive Feature Selection: A Synergistic Approach to Video Question Answering	Dec 12, 2024	feature selectionLanguage Modeling	—Unverified
RealCQA-V2 : Visual Premise Proving A Manual COT Dataset for Charts	Oct 29, 2024	Chart Question AnsweringQuestion Answering	—Unverified
Assessing Users' Reputation from Syntactic and Semantic Information in Community Question Answering	May 1, 2020	Community Question AnsweringQuestion Answering	—Unverified
Foundation Models for Natural Language Processing -- Pre-trained Language Models Integrating Media	Feb 16, 2023	Question AnsweringStory Generation	—Unverified
GMSA: Enhancing Context Compression via Group Merging and Layer Semantic Alignment	May 18, 2025	Computational EfficiencyQuestion Answering	—Unverified
Complementary Evidence Identification in Open-Domain Question Answering	Mar 22, 2021	DiversityEvidence Selection	—Unverified

Show:10 25 50

← PrevPage 320 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified