Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7851–7875 of 10817 papers

Title	Date	Tasks	Status
Question Answering with Deep Neural Networks for Semi-Structured Heterogeneous Genealogical Knowledge Graphs	Jul 30, 2023	Knowledge GraphsQuestion Answering	—Unverified
Question-Answering with Grammatically-Interpretable Representations	May 23, 2017	Inductive BiasQuestion Answering	—Unverified
Question Answering with Knowledge Base, Web and Beyond	Jun 1, 2016	Question AnsweringText Matching	—Unverified
Question-Answering with Logic Specific to Video Games	May 1, 2016	ClusteringMinecraft	—Unverified
GPTs and Language Barrier: A Cross-Lingual Legal QA Examination	Mar 26, 2024	ArticlesBenchmarking	—Unverified
GPTR: Gestalt-Perception Transformer for Diagram Object Detection	Dec 29, 2022	DecoderObject	—Unverified
Question Answering with Texts and Tables through Deep Reinforcement Learning	Jul 5, 2024	Deep Reinforcement LearningQuestion Answering	—Unverified
Question-Answer Selection in User to User Marketplace Conversations	Feb 6, 2018	Answer SelectionQuestion Answering	—Unverified
CompMix: A Benchmark for Heterogeneous Question Answering	Jun 21, 2023	Question Answering	—Unverified
GPT4Video: A Unified Multimodal Large Language Model for lnstruction-Followed Understanding and Safety-Aware Generation	Nov 25, 2023	Instruction FollowingLanguage Modeling	—Unverified
FinQAPT: Empowering Financial Decisions with End-to-End LLM-driven Question Answering Pipeline	Oct 17, 2024	Decision MakingQuestion Answering	—Unverified
Question-Aware Memory Network for Multi-hop Question Answering in Human-Robot Interaction	Apr 27, 2021	Graph EmbeddingGraph Question Answering	—Unverified
GPT-4V Explorations: Mining Autonomous Driving	Jun 24, 2024	Autonomous DrivingDecision Making	—Unverified
Question-aware Transformer Models for Consumer Health Question Summarization	Jun 1, 2021	Abstractive Text SummarizationDecoder	—Unverified
Incorporating Question Answering-Based Signals into Abstractive Summarization via Salient Span Selection	Nov 15, 2021	Abstractive Text SummarizationQuestion Answering	—Unverified
Question Calibration and Multi-Hop Modeling for Temporal Question Answering	Feb 20, 2024	Knowledge GraphsMulti-hop Question Answering	—Unverified
GPT4GEO: How a Language Model Sees the World's Geography	May 30, 2023	Disaster ResponseLanguage Modeling	—Unverified
Question Classification Transfer	Aug 1, 2013	ClassificationGeneral Classification	—Unverified
FireAct: Toward Language Agent Fine-tuning	Oct 9, 2023	Question Answering	—Unverified
Question-Conditioned Counterfactual Image Generation for VQA	Nov 14, 2019	counterfactualImage Generation	—Unverified
A Stacking Gated Neural Architecture for Implicit Discourse Relation Classification	Nov 1, 2016	Feature EngineeringGeneral Classification	—Unverified
A Causal Approach to Mitigate Modality Preference Bias in Medical Visual Question Answering	May 22, 2025	counterfactualMedical Visual Question Answering	—Unverified
Gpt-4: A Review on Advancements and Opportunities in Natural Language Processing	May 4, 2023	Language ModelingLanguage Modelling	—Unverified
GPT-3 Models are Few-Shot Financial Reasoners	Jul 25, 2023	Financial AnalysisPrompt Engineering	—Unverified
GOVERN: Gradient Orientation Vote Ensemble for Multi-Teacher Reinforced Distillation	May 6, 2024	Knowledge DistillationQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 315 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified