Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7201–7225 of 10817 papers

Title	Date	Tasks	Status
AMR Parsing with an Incremental Joint Model	Nov 1, 2016	Abstractive Text SummarizationAMR Parsing	—Unverified
HAIR: Hierarchical Visual-Semantic Relational Reasoning for Video Question Answering	Jan 1, 2021	Question AnsweringRelational Reasoning	—Unverified
Order Matters: Exploring Order Sensitivity in Multimodal Large Language Models	Oct 22, 2024	In-Context LearningQuestion Answering	—Unverified
LLM-aided explanations of EDA synthesis errors	Apr 7, 2024	Question AnsweringReading Comprehension	—Unverified
A Study on Multimodal and Interactive Explanations for Visual Question Answering	Mar 1, 2020	Explainable Artificial Intelligence (XAI)Prediction	—Unverified
ORION: A Holistic End-to-End Autonomous Driving Framework by Vision-Language Instructed Action Generation	Mar 25, 2025	Action GenerationAutonomous Driving	—Unverified
PathVLM-R1: A Reinforcement Learning-Driven Reasoning Model for Pathology Visual-Language Tasks	Apr 12, 2025	Computed Tomography (CT)Question Answering	—Unverified
Orthogonality of Syntax and Semantics within Distributional Spaces	Jul 1, 2015	Machine TranslationQuestion Answering	—Unverified
Patience is all you need! An agentic system for performing scientific literature review	Mar 28, 2025	AllArticles	—Unverified
Orthogonality regularizer for question answering	Aug 1, 2016	Information RetrievalOpen-Domain Question Answering	—Unverified
OSU\_CHGCG at SemEval-2016 Task 9 : Chinese Semantic Dependency Parsing with Generalized Categorial Grammar	Jun 1, 2016	Dependency ParsingQuestion Answering	—Unverified
Connecting Language and Vision to Actions	Jul 1, 2018	Image CaptioningLanguage Modeling	—Unverified
Explanation as Question Answering based on a Task Model of the Agent's Design	Jun 8, 2022	AI AgentQuestion Answering	—Unverified
Out of the Box: Reasoning with Graph Convolution Nets for Factual Visual Question Answering	Nov 1, 2018	Factual Visual Question AnsweringGeneral Knowledge	—Unverified
Hadamard product in deep learning: Introduction, Advances and Challenges	Apr 17, 2025	Computational EfficiencyDeep Learning	—Unverified
AMRITA\_CEN@SemEval-2015: Paraphrase Detection for Twitter using Unsupervised Feature Learning with Recursive Autoencoders	Jun 1, 2015	Information RetrievalMachine Translation	—Unverified
Overcoming Language Bias in Remote Sensing Visual Question Answering via Adversarial Training	Jun 1, 2023	Question AnsweringVisual Question Answering	—Unverified
Overcoming Language Priors for Visual Question Answering Based on Knowledge Distillation	Jan 10, 2025	Knowledge DistillationQuestion Answering	—Unverified
PathReasoner: Modeling Reasoning Path with Equivalent Extension for Logical Question Answering	May 29, 2024	DiversityLogical Reasoning	—Unverified
Architecture for a Trustworthy Quantum Chatbot	Mar 6, 2025	ChatbotLarge Language Model	—Unverified
GW\_QA at SemEval-2017 Task 3: Question Answer Re-ranking on Arabic Fora	Aug 1, 2017	Answer SelectionBIG-bench Machine Learning	—Unverified
Overcoming the vanishing gradient problem in plain recurrent networks	Jan 18, 2018	Permuted-MNISTQuestion Answering	—Unverified
A Study on Expert Sourcing Enterprise Question Collection and Classification	May 1, 2014	General ClassificationQuestion Answering	—Unverified
Overinformative Question Answering by Humans and Machines	May 11, 2023	Question Answering	—Unverified
Accelerating Real-Time Question Answering via Question Generation	Sep 10, 2020	Data AugmentationMulti-Task Learning	—Unverified

Show:10 25 50

← PrevPage 289 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified