Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5901–5925 of 10817 papers

Title	Date	Tasks	Status
Learning to Recognize the Unseen Visual Predicates	Sep 25, 2019	Question AnsweringVisual Question Answering	—Unverified
Locate Then Generate: Bridging Vision and Language with Bounding Box for Scene-Text VQA	Apr 4, 2023	Answer GenerationLanguage Modelling	—Unverified
Neural Reasoning, Fast and Slow, for Video Question Answering	Jul 10, 2019	Natural QuestionsQuestion Answering	—Unverified
Learning to Reason Over Time: Timeline Self-Reflection for Improved Temporal Reasoning in Language Models	Apr 7, 2025	Question AnsweringScheduling	—Unverified
Learning to Reason Iteratively and Parallelly for Complex Visual Reasoning Scenarios	Nov 20, 2024	Question AnsweringVisual Question Answering (VQA)	—Unverified
Distributional Hypernym Generation by Jointly Learning Clusters and Projections	Dec 1, 2016	ClusteringGeneral Classification	—Unverified
Learning to Rank Answer Candidates for Automatic Resolution of Crossword Puzzles	Jun 1, 2014	Learning-To-RankQuestion Answering	—Unverified
LearningToQuestion at SemEval 2017 Task 3: Ranking Similar Questions by Learning to Rank Using Rich Features	Aug 1, 2017	Information RetrievalLearning-To-Rank	—Unverified
Distributed Deep Learning for Question Answering	Nov 3, 2015	Answer SelectionDeep Learning	—Unverified
Benchmarking Table Comprehension In The Wild	Dec 13, 2024	BenchmarkingQuestion Answering	—Unverified
Logical Inference on Dependency-based Compositional Semantics	Jun 1, 2014	Question Answering	—Unverified
Logically Consistent Loss for Visual Question Answering	Nov 19, 2020	Multi-Task LearningQuestion Answering	—Unverified
Logical Parsing from Natural Language Based on a Neural Translation Model	May 9, 2017	Question AnsweringSemantic Parsing	—Unverified
Logical Story Representations via FrameNet + Semantic Parsing	Jan 16, 2022	Formal LogicQuestion Answering	—Unverified
Learning to Plan and Generate Text with Citations	Apr 4, 2024	Long Form Question AnsweringQuestion Answering	—Unverified
Distraction-free Embeddings for Robust VQA	Aug 31, 2023	Question AnsweringVideo Question Answering	—Unverified
Learning to Paraphrase for Question Answering	Aug 20, 2017	Question AnsweringSentence	—Unverified
Logic-in-Frames: Dynamic Keyframe Search via Visual Semantic-Logical Verification for Long Video Understanding	Mar 17, 2025	AttributeMME	—Unverified
LEARNING TO ORGANIZE KNOWLEDGE WITH N-GRAM MACHINES	Jan 1, 2018	Language ModelingLanguage Modelling	—Unverified
Distinguish Before Answer: Generating Contrastive Explanation as Knowledge for Commonsense Question Answering	May 14, 2023	Explanation GenerationQuestion Answering	—Unverified
Learning to Organize Knowledge and Answer Questions with N-Gram Machines	Nov 17, 2017	Open-Domain Question AnsweringQuestion Answering	—Unverified
Learning to Order Sub-questions for Complex Question Answering	Nov 11, 2019	Question AnsweringReinforcement Learning	—Unverified
Distill-SynthKG: Distilling Knowledge Graph Synthesis Workflow for Improved Coverage and Efficiency	Oct 22, 2024	Knowledge GraphsQuestion Answering	—Unverified
Benchmarking Retrieval-Augmented Large Language Models in Biomedical NLP: Application, Robustness, and Self-Awareness	May 13, 2024	Benchmarkingcounterfactual	—Unverified
An Inference Approach To Question Answering Over Knowledge Graphs	Dec 21, 2021	Knowledge GraphsQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 237 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified