Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7201–7250 of 10817 papers

Title	Date	Tasks	Status
Hallucination Augmented Recitations for Language Models	Nov 13, 2023	counterfactualHallucination	—Unverified
Orca 2: Teaching Small Language Models How to Reason	Nov 18, 2023	Arithmetic ReasoningCommon Sense Reasoning	—Unverified
Order Matters: Exploring Order Sensitivity in Multimodal Large Language Models	Oct 22, 2024	In-Context LearningQuestion Answering	—Unverified
LLM-aided explanations of EDA synthesis errors	Apr 7, 2024	Question AnsweringReading Comprehension	—Unverified
Hallucination at a Glance: Controlled Visual Edits and Fine-Grained Multimodal Learning	Jun 8, 2025	AttributeHallucination	—Unverified
ORION: A Holistic End-to-End Autonomous Driving Framework by Vision-Language Instructed Action Generation	Mar 25, 2025	Action GenerationAutonomous Driving	—Unverified
CONQRR: Conversational Query Rewriting for Retrieval with Reinforcement Learning	Dec 16, 2021	Conversational Question AnsweringPassage Retrieval	—Unverified
Orthogonality of Syntax and Semantics within Distributional Spaces	Jul 1, 2015	Machine TranslationQuestion Answering	—Unverified
Is There No Such Thing as a Bad Question? H4R: HalluciBot For Ratiocination, Rewriting, Ranking, and Routing	Apr 18, 2024	HallucinationMultiple-choice	—Unverified
Orthogonality regularizer for question answering	Aug 1, 2016	Information RetrievalOpen-Domain Question Answering	—Unverified
OSU\_CHGCG at SemEval-2016 Task 9 : Chinese Semantic Dependency Parsing with Generalized Categorial Grammar	Jun 1, 2016	Dependency ParsingQuestion Answering	—Unverified
AMR Parsing with an Incremental Joint Model	Nov 1, 2016	Abstractive Text SummarizationAMR Parsing	—Unverified
Explanation as Question Answering based on a Task Model of the Agent's Design	Jun 8, 2022	AI AgentQuestion Answering	—Unverified
Out of the Box: Reasoning with Graph Convolution Nets for Factual Visual Question Answering	Nov 1, 2018	Factual Visual Question AnsweringGeneral Knowledge	—Unverified
HAIR: Hierarchical Visual-Semantic Relational Reasoning for Video Question Answering	Jan 1, 2021	Question AnsweringRelational Reasoning	—Unverified
A Study on Multimodal and Interactive Explanations for Visual Question Answering	Mar 1, 2020	Explainable Artificial Intelligence (XAI)Prediction	—Unverified
Overcoming Language Bias in Remote Sensing Visual Question Answering via Adversarial Training	Jun 1, 2023	Question AnsweringVisual Question Answering	—Unverified
Overcoming Language Priors for Visual Question Answering Based on Knowledge Distillation	Jan 10, 2025	Knowledge DistillationQuestion Answering	—Unverified
Overcoming Language Priors in Visual Question Answering with Adversarial Regularization	Oct 8, 2018	Question AnsweringVisual Grounding	—Unverified
Architecture for a Trustworthy Quantum Chatbot	Mar 6, 2025	ChatbotLarge Language Model	—Unverified
PeCoQ: A Dataset for Persian Complex Question Answering over Knowledge Graph	Jun 27, 2021	Knowledge GraphsQuestion Answering	—Unverified
Overcoming the vanishing gradient problem in plain recurrent networks	Jan 18, 2018	Permuted-MNISTQuestion Answering	—Unverified
Overfitting at SemEval-2016 Task 3: Detecting Semantically Similar Questions in Community Question Answering Forums with Word Embeddings	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
Overinformative Question Answering by Humans and Machines	May 11, 2023	Question Answering	—Unverified
Overview of BioASQ 2020: The eighth BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering	Jun 28, 2021	Question Answering	—Unverified
Overview of BioASQ 2021: The ninth BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering	Jun 28, 2021	Question Answering	—Unverified
Connecting Language and Vision to Actions	Jul 1, 2018	Image CaptioningLanguage Modeling	—Unverified
Overview of BioASQ 2023: The eleventh BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering	Jul 11, 2023	Question Answering	—Unverified
Overview of Factify5WQA: Fact Verification through 5W Question-Answering	Oct 5, 2024	Fact VerificationFake News Detection	—Unverified
Hadamard product in deep learning: Introduction, Advances and Challenges	Apr 17, 2025	Computational EfficiencyDeep Learning	—Unverified
AMRITA\_CEN@SemEval-2015: Paraphrase Detection for Twitter using Unsupervised Feature Learning with Recursive Autoencoders	Jun 1, 2015	Information RetrievalMachine Translation	—Unverified
Overview of the MedVidQA 2022 Shared Task on Medical Video Question-Answering	May 1, 2022	Question AnsweringVideo Classification	—Unverified
Overview of the NLPCC 2025 Shared Task 4: Multi-modal, Multilingual, and Multi-hop Medical Instructional Video Question Answering Challenge	May 11, 2025	Multimodal ReasoningQuestion Answering	—Unverified
Overview of TREC 2024 Biomedical Generative Retrieval (BioGen) Track	Nov 27, 2024	Medical Question AnsweringQuestion Answering	—Unverified
PEACE: Empowering Geologic Map Holistic Understanding with MLLMs	Jan 10, 2025	Question Answering	—Unverified
OVQA: A Clinically Generated Visual Question Answering Dataset	Jul 7, 2022	BenchmarkingMedical Visual Question Answering	—Unverified
GW\_QA at SemEval-2017 Task 3: Question Answer Re-ranking on Arabic Fora	Aug 1, 2017	Answer SelectionBIG-bench Machine Learning	—Unverified
P^3LM: Probabilistically Permuted Prophet Language Modeling for Generative Pre-Training	Oct 22, 2022	Conversational Question AnsweringDecoder	—Unverified
PABI: A Unified PAC-Bayesian Informativeness Measure for Incidental Supervision Signals	Jan 1, 2021	Informativenessnamed-entity-recognition	—Unverified
PaCCSS-IT: A Parallel Corpus of Complex-Simple Sentences for Automatic Text Simplification	Nov 1, 2016	Dependency ParsingDomain Adaptation	—Unverified
A Study on Expert Sourcing Enterprise Question Collection and Classification	May 1, 2014	General ClassificationQuestion Answering	—Unverified
Accelerating Real-Time Question Answering via Question Generation	Sep 10, 2020	Data AugmentationMulti-Task Learning	—Unverified
PEBench: A Fictitious Dataset to Benchmark Machine Unlearning for Multimodal Large Language Models	Mar 16, 2025	Machine UnlearningPrivacy Preserving	—Unverified
P\'agico: Evaluating Wikipedia-based information retrieval in Portuguese	May 1, 2012	Cultural Vocal Bursts Intensity PredictionInformation Retrieval	—Unverified
Paired Examples as Indirect Supervision in Latent Decision Models	Apr 5, 2021	Out-of-Distribution GeneralizationQuestion Answering	—Unverified
Exploiting Bilingual Translation for Question Retrieval in Community-Based Question Answering	Dec 1, 2012	Community Question AnsweringMachine Translation	—Unverified
Confidence Estimation for Knowledge Base Population	Sep 1, 2013	Knowledge Base PopulationMachine Translation	—Unverified
Pairwise Relation Classification with Mirror Instances and a Combined Convolutional Neural Network	Dec 1, 2016	ClassificationGeneral Classification	—Unverified
Pairwise Word Interaction Modeling with Deep Neural Networks for Semantic Similarity Measurement	Jun 1, 2016	Answer SelectionParaphrase Generation	—Unverified
GUITAR: Gradient Pruning toward Fast Neural Ranking	Dec 28, 2023	Question AnsweringRepresentation Learning	—Unverified

Show:10 25 50

← PrevPage 145 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified