Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9801–9850 of 10817 papers

Title	Date	Tasks	Status
Extending Compositional Attention Networks for Social Reasoning in Videos	Oct 3, 2022	Question AnsweringVideo Question Answering	CodeCode Available
Question Directed Graph Attention Network for Numerical Reasoning over Text	Sep 16, 2020	Graph AttentionMachine Reading Comprehension	CodeCode Available
An Adaptive Framework for Generating Systematic Explanatory Answer in Online Q&A Platforms	Oct 23, 2024	Answer GenerationInformation Retrieval	CodeCode Available
A Question-Entailment Approach to Question Answering	Jan 23, 2019	Information RetrievalQuestion Answering	CodeCode Available
COLD: Causal reasOning in cLosed Daily activities	Nov 29, 2024	Causal InferenceCommonsense Causal Reasoning	CodeCode Available
ColBERT Retrieval and Ensemble Response Scoring for Language Model Question Answering	Aug 20, 2024	Language ModelingLanguage Modelling	CodeCode Available
Near-Negative Distinction: Giving a Second Life to Human Evaluation Datasets	May 13, 2022	nlg evaluationQuestion Answering	CodeCode Available
Learning to Represent Bilingual Dictionaries	Aug 10, 2018	Multi-Task LearningParaphrase Identification	CodeCode Available
Exploring the zero-shot limit of FewRel	Dec 1, 2020	Language ModelingLanguage Modelling	CodeCode Available
Exploring The Visual Feature Space for Multimodal Neural Decoding	May 21, 2025	Brain DecodingQuestion Answering	CodeCode Available
Learning to Search in Long Documents Using Document Structure	Jun 9, 2018	Information RetrievalQuestion Answering	CodeCode Available
Learning to Select from Multiple Options	Dec 1, 2022	Entity TypingIntent Detection	CodeCode Available
Pragmatic Issue-Sensitive Image Captioning	Apr 29, 2020	DescriptiveImage Captioning	CodeCode Available
Question Embeddings Based on Shannon Entropy: Solving intent classification task in goal-oriented dialogue system	Mar 25, 2019	General Classificationintent-classification	CodeCode Available
Cognitive Weave: Synthesizing Abstracted Knowledge with a Spatio-Temporal Resonance Graph	Jun 9, 2025	Large Language ModelQuestion Answering	CodeCode Available
Learning to Skim Text	Apr 23, 2017	Document ClassificationGeneral Classification	CodeCode Available
Negated and Misprimed Probes for Pretrained Language Models: Birds Can Talk, But Cannot Fly	Nov 8, 2019	Language ModellingNegation	CodeCode Available
Negation in Cognitive Reasoning	Dec 23, 2020	Formal LogicNegation	CodeCode Available
Reinforced Dynamic Reasoning for Conversational Question Generation	Jul 29, 2019	DecoderQuestion Answering	CodeCode Available
Automated Text-to-Table for Reasoning-Intensive Table QA: Pipeline Design and Benchmarking Insights	May 26, 2025	BenchmarkingQuestion Answering	CodeCode Available
Question Generation by Transformers	Sep 9, 2019	ArticlesQuestion Answering	CodeCode Available
SemEval-2019 Task 8: Fact Checking in Community Question Answering Forums	May 25, 2019	Community Question AnsweringFact Checking	CodeCode Available
NeoQA: Evidence-based Question Answering with Generated News Events	May 9, 2025	ArticlesQuestion Answering	CodeCode Available
Cognitive Visual Commonsense Reasoning Using Dynamic Working Memory	Jul 4, 2021	Question AnsweringScene Understanding	CodeCode Available
Reinforced Mnemonic Reader for Machine Reading Comprehension	May 8, 2017	Machine Reading ComprehensionQuestion Answering	CodeCode Available
ActivityNet-QA: A Dataset for Understanding Complex Web Videos via Question Answering	Jun 6, 2019	Question AnsweringVideo Question Answering	CodeCode Available
Exploring the Readiness of Prominent Small Language Models for the Democratization of Financial Literacy	Oct 9, 2024	Few-Shot LearningQuestion Answering	CodeCode Available
Specification and Evaluation of Multi-Agent LLM Systems -- Prototype and Cybersecurity Applications	Jun 12, 2025	Code GenerationQuestion Answering	CodeCode Available
A Question-Centric Model for Visual Question Answering in Medical Imaging	Mar 2, 2020	Medical Image AnalysisQuestion Answering	CodeCode Available
Learning Visual Question Answering by Bootstrapping Hard Attention	Aug 1, 2018	Hard AttentionQuestion Answering	CodeCode Available
Learning What is Essential in Questions	Aug 1, 2017	Information RetrievalQuestion Answering	CodeCode Available
Neural Arabic Question Answering	Jun 12, 2019	ArticlesInformation Retrieval	CodeCode Available
A Mutual Information Maximization Approach for the Spurious Solution Problem in Weakly Supervised Question Answering	Jun 14, 2021	Question Answering	CodeCode Available
HumaniBench: A Human-Centric Framework for Large Multimodal Models Evaluation	May 16, 2025	BenchmarkingEthics	CodeCode Available
Auto-hMDS: Automatic Construction of a Large Heterogeneous Multilingual Multi-Document Summarization Corpus	May 1, 2018	Abstractive Text SummarizationDocument Summarization	CodeCode Available
Question-Instructed Visual Descriptions for Zero-Shot Video Question Answering	Feb 16, 2024	Language ModelingLanguage Modelling	CodeCode Available
Cognitive Graph for Multi-Hop Reading Comprehension at Scale	May 14, 2019	Graph Neural NetworkMulti-hop Question Answering	CodeCode Available
Exploring the Effect of Primitives for Compositional Generalization in Vision-and-Language	Jan 1, 2023	Question AnsweringSelf-Supervised Learning	CodeCode Available
Safeguarding Data in Multimodal AI: A Differentially Private Approach to CLIP Training	Jun 13, 2023	image-classificationImage Classification	CodeCode Available
KnowledgePrompts: Exploring the Abilities of Large Language Models to Solve Proportional Analogies via Knowledge-Enhanced Prompting	Dec 1, 2024	Multiple-choiceMultiple Choice Question Answering (MCQA)	CodeCode Available
Question Answering as an Automatic Evaluation Metric for News Article Summarization	Jun 2, 2019	Headline GenerationQuestion Answering	CodeCode Available
Exploring Temporal Concurrency for Video-Language Representation Learning	Jan 1, 2023	Dynamic Time WarpingMetric Learning	CodeCode Available
Robust Question Answering against Distribution Shifts with Test-Time Adaptation: An Empirical Study	Feb 9, 2023	Imitation LearningQuestion Answering	CodeCode Available
Exploring Neural Language Models via Analysis of Local and Global Self-Attention Spaces	Apr 1, 2021	Machine TranslationQuestion Answering	CodeCode Available
Neural Domain Adaptation for Biomedical Question Answering	Jun 12, 2017	ArticlesDomain Adaptation	CodeCode Available
Neural Duplicate Question Detection without Labeled Training Data	Nov 13, 2019	Answer SelectionCommunity Question Answering	CodeCode Available
LEGAL-UQA: A Low-Resource Urdu-English Dataset for Legal Question Answering	Oct 16, 2024	Optical Character Recognition (OCR)Question Answering	CodeCode Available
AutoBench-V: Can Large Vision-Language Models Benchmark Themselves?	Oct 28, 2024	BenchmarkingQuestion Answering	CodeCode Available
A Unified Syntax-aware Framework for Semantic Role Labeling	Oct 1, 2018	Machine TranslationQuestion Answering	CodeCode Available
Exploring Modulated Detection Transformer as a Tool for Action Recognition in Videos	Sep 21, 2022	Action DetectionAction Recognition	CodeCode Available

Show:10 25 50

← PrevPage 197 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified