Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4601–4650 of 10817 papers

Title	Date	Tasks	Status
Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction	Apr 24, 2025	Conformal PredictionHallucination	—Unverified
Automatic Coupling of Answer Extraction and Information Retrieval	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Advances in Natural Language Question Answering: A Review	Apr 10, 2019	Deep LearningQuestion Answering	—Unverified
Data augmentation techniques for the Video Question Answering task	Aug 22, 2020	Data AugmentationQuestion Answering	—Unverified
Automatic Compound Processing: Compound Splitting and Semantic Analysis for Afrikaans and Dutch	Aug 1, 2014	Machine TranslationQuestion Answering	—Unverified
Interpretable Counting for Visual Question Answering	Dec 23, 2017	Question AnsweringVisual Question Answering	—Unverified
Interpretable Face Anti-Spoofing: Enhancing Generalization with Multimodal Large Language Models	Jan 3, 2025	Binary ClassificationFace Anti-Spoofing	—Unverified
Data Augmentation for Visual Question Answering	Sep 1, 2017	Data AugmentationGeneral Classification	—Unverified
Automatic classification of doctor-patient questions for a virtual patient record query task	Aug 1, 2017	BIG-bench Machine LearningDialogue Management	—Unverified
Automatic Claim Review for Climate Science via Explanation Generation	Jul 30, 2021	DecoderExplanation Generation	—Unverified
Data Augmentation for Biomedical Factoid Question Answering	Jan 16, 2022	Data AugmentationInformation Retrieval	—Unverified
Data Augmentation for BERT Fine-Tuning in Open-Domain Question Answering	Apr 14, 2019	Data AugmentationOpen-Domain Question Answering	—Unverified
A Collection of Question Answering Datasets for Norwegian	Jan 19, 2025	Question AnsweringWorld Knowledge	—Unverified
DARE: Diverse Visual Question Answering with Robustness Evaluation	Sep 26, 2024	image-classificationImage Classification	—Unverified
Automatic Building and Using Parallel Resources for SMT from Comparable Corpora	Apr 1, 2014	Machine TranslationNatural Language Inference	—Unverified
Danoliteracy of Generative, Large Language Models	Oct 30, 2024	Question Answering	—Unverified
Medical Knowledge Graph QA for Drug-Drug Interaction Prediction based on Multi-hop Machine Reading Comprehension	Dec 19, 2022	Entity EmbeddingsGraph Neural Network	—Unverified
Advances in Multi-turn Dialogue Comprehension: A Survey	Mar 4, 2021	DiversityLanguage Modelling	—Unverified
Dynamic Clue Bottlenecks: Towards Interpretable-by-Design Visual Question Answering	May 24, 2023	Question AnsweringVisual Question Answering	—Unverified
Interpretable LLM-based Table Question Answering	Dec 16, 2024	POSQuestion Answering	—Unverified
DaNetQA: a yes/no Question Answering Dataset for the Russian Language	Oct 6, 2020	Question AnsweringSentence	—Unverified
Damage Assessment after Natural Disasters with UAVs: Semantic Feature Extraction using Deep Learning	Dec 14, 2024	Decision MakingQuestion Answering	—Unverified
Automatically Extracting Procedural Knowledge from Instructional Texts using Natural Language Processing	May 1, 2012	Question Answering	—Unverified
An Efficient Active Learning Framework for New Relation Types	Oct 1, 2013	Active LearningQuestion Answering	—Unverified
DAHRS: Divergence-Aware Hallucination-Remediated SRL Projection	Jul 12, 2024	fr-enHallucination	—Unverified
Automatically Developing a Fine-grained Arabic Named Entity Corpus and Gazetteer by utilizing Wikipedia	Oct 1, 2013	Question AnsweringTransliteration	—Unverified
DAFE: LLM-Based Evaluation Through Dynamic Arbitration for Free-Form Question-Answering	Mar 11, 2025	FormInstruction Following	—Unverified
DADgraph: A Discourse-aware Dialogue Graph Neural Network for Multiparty Dialogue Machine Reading Comprehension	Apr 26, 2021	Graph Neural NetworkMachine Reading Comprehension	—Unverified
Automated Utterance Generation	Apr 7, 2020	Extractive SummarizationQuestion Answering	—Unverified
An Effective Multi-Stage Approach For Question Answering	Jul 10, 2019	Machine Reading ComprehensionNatural Language Understanding	—Unverified
Advancements and Challenges in Bangla Question Answering Models: A Comprehensive Review	Dec 16, 2024	ArticlesQuestion Answering	—Unverified
An Effective Contextual Language Modeling Framework for Speech Summarization with Augmented Features	Jun 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ARTEMIS-DA: An Advanced Reasoning and Transformation Engine for Multi-Step Insight Synthesis in Data Analytics	Dec 18, 2024	Code GenerationInformation Retrieval	—Unverified
Cycle-Consistency for Robust Visual Question Answering	Feb 15, 2019	Question AnsweringQuestion Generation	—Unverified
Automated Testing and Improvement of Named Entity Recognition Systems	Aug 14, 2023	named-entity-recognitionNamed Entity Recognition	—Unverified
VRBench: A Benchmark for Multi-Step Reasoning in Long Narrative Videos	Jun 12, 2025	Question Answering	—Unverified
CyberBOT: Towards Reliable Cybersecurity Education via Ontology-Grounded Retrieval Augmented Generation	Apr 1, 2025	ChatbotQuestion Answering	—Unverified
Automated Story Generation as Question-Answering	Dec 7, 2021	Generative Question AnsweringLanguage Modeling	—Unverified
CVQA: Culturally-diverse Multilingual Visual Question Answering Benchmark	Jun 10, 2024	DiversityQuestion Answering	—Unverified
ANEC: An Amharic Named Entity Corpus and Transformer Based Recognizer	Jul 2, 2022	imbalanced classificationInformation Retrieval	—Unverified
A Cognitive Ideation Support Framework using IBM Watson Services	Dec 18, 2024	Question Answering	—Unverified
Interpretable AMR-Based Question Decomposition for Multi-hop Question Answering	Jun 16, 2022	Abstract Meaning RepresentationAMR-to-Text Generation	—Unverified
Interpretable Bilingual Multimodal Large Language Model for Diverse Biomedical Tasks	Oct 24, 2024	image-classificationImage Classification	—Unverified
C-VQA: A Compositional Split of the Visual Question Answering (VQA) v1.0 Dataset	Apr 26, 2017	Question AnsweringVisual Question Answering	—Unverified
Automated Historical Fact-Checking by Passage Retrieval, Word Statistics, and Virtual Question-Answering	Nov 1, 2017	Fact CheckingPassage Retrieval	—Unverified
Automated Graph Generation at Sentence Level for Reading Comprehension Based on Conceptual Graphs	Dec 1, 2020	Graph GenerationMiscellaneous	—Unverified
Cut to the Chase: A Context Zoom-in Network for Reading Comprehension	Oct 1, 2018	Question AnsweringReading Comprehension	—Unverified
A Coarse to Fine Question Answering System based on Reinforcement Learning	Jun 1, 2021	Deep Reinforcement LearningQuestion Answering	—Unverified
Internal and External Knowledge Interactive Refinement Framework for Knowledge-Intensive Question Answering	Aug 23, 2024	HallucinationQuestion Answering	—Unverified
Curriculum Script Distillation for Multilingual Visual Question Answering	Jan 17, 2023	Question AnsweringVisual Question Answering	—Unverified

Show:10 25 50

← PrevPage 93 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified