Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10601–10650 of 10817 papers

Title	Date	Tasks	Status
Multilingual Multi-Aspect Explainability Analyses on Machine Reading Comprehension Models	Aug 26, 2021	Machine Reading ComprehensionQuestion Answering	CodeCode Available
Systematic Inequalities in Language Technology Performance across the World's Languages	Oct 13, 2021	Dependency ParsingMachine Translation	CodeCode Available
Zero-Shot Open-Book Question Answering	Nov 22, 2021	Information RetrievalNatural Questions	CodeCode Available
SynTQA: Synergistic Table-based Question Answering via Mixture of Text-to-SQL and E2E TQA	Sep 25, 2024	Answer SelectionQuestion Answering	CodeCode Available
VIGNETTE: Socially Grounded Bias Evaluation for Vision-Language Models	May 28, 2025	Decision MakingQuestion Answering	CodeCode Available
Synthetic Knowledge Ingestion: Towards Knowledge Refinement and Injection for Enhancing Large Language Models	Oct 12, 2024	Question AnsweringRAG	CodeCode Available
Weakly Supervised Formula Learner for Solving Mathematical Problems	Oct 1, 2022	Mathematical ReasoningQuestion Answering	CodeCode Available
SituatedThinker: Grounding LLM Reasoning with Real-World through Situated Thinking	May 25, 2025	Mathematical ReasoningMulti-hop Question Answering	CodeCode Available
Single-Stream Multi-Level Alignment for Vision-Language Pretraining	Mar 27, 2022	Image-text RetrievalQuestion Answering	CodeCode Available
Understanding Multimodal LLMs: the Mechanistic Interpretability of Llava in Visual Question Answering	Nov 17, 2024	HallucinationIn-Context Learning	CodeCode Available
Synthetic Document Question Answering in Hungarian	May 29, 2025	Optical Character Recognition (OCR)Question Answering	CodeCode Available
Synthetic Dataset Creation and Fine-Tuning of Transformer Models for Question Answering in Serbian	Apr 12, 2024	Question Answering	CodeCode Available
Semi-Parametric Retrieval via Binary Bag-of-Tokens Index	May 3, 2024	Information RetrievalOpen-Domain Question Answering	CodeCode Available
VinVL+L: Enriching Visual Representation with Location Context in VQA	Feb 22, 2023	Question AnsweringTAG	CodeCode Available
Synthetic Data Generation with Large Language Models for Personalized Community Question Answering	Oct 29, 2024	Community Question AnsweringInformation Retrieval	CodeCode Available
Synthesizing Sentiment-Controlled Feedback For Multimodal Text and Image Data	Feb 12, 2024	DecoderMarketing	CodeCode Available
ViQAgent: Zero-Shot Video Question Answering via Agent with Open-Vocabulary Grounding Validation	May 21, 2025	Decision MakingLanguage Modeling	CodeCode Available
Understanding the World's Museums through Vision-Language Reasoning	Dec 2, 2024	BenchmarkingQuestion Answering	CodeCode Available
ViQuAE, a Dataset for Knowledge-based Visual Question Answering about Named Entities	Nov 16, 2021	ArticlesFace Recognition	CodeCode Available
Syntax for Semantic Role Labeling, To Be, Or Not To Be	Jul 1, 2018	Dependency ParsingFeature Engineering	CodeCode Available
Syn-QA2: Evaluating False Assumptions in Long-tail Questions with Synthetic QA Datasets	Mar 18, 2024	Question Answering	CodeCode Available
Tokenization Consistency Matters for Generative Models on Extractive NLP Tasks	Dec 19, 2022	Extractive Question-AnsweringHallucination	CodeCode Available
U-Net: Machine Reading Comprehension with Unanswerable Questions	Oct 12, 2018	Machine Reading ComprehensionQuestion Answering	CodeCode Available
SynFinTabs: A Dataset of Synthetic Financial Tables for Information and Table Extraction	Dec 5, 2024	ArticlesDataset Generation	CodeCode Available
To Attend or not to Attend: A Case Study on Syntactic Structures for Semantic Relatedness	Jul 1, 2018	Machine TranslationParaphrase Identification	CodeCode Available
Tip of the Tongue Query Elicitation for Simulated Evaluation	Feb 25, 2025	Community Question AnsweringQuestion Answering	CodeCode Available
Weakly-Supervised Open-Retrieval Conversational Question Answering	Mar 3, 2021	Conversational Question AnsweringQuestion Answering	CodeCode Available
VisFIS: Visual Feature Importance Supervision with Right-for-the-Right-Reason Objectives	Jun 22, 2022	Feature ImportanceQuestion Answering	CodeCode Available
Weakly-Supervised Questions for Zero-Shot Relation Extraction	Jan 21, 2023	Question AnsweringRelation	CodeCode Available
Time-R1: Towards Comprehensive Temporal Reasoning in LLMs	May 16, 2025	Question AnsweringReinforcement Learning (RL)	CodeCode Available
Weakly Supervised Relative Spatial Reasoning for Visual Question Answering	Sep 4, 2021	Question AnsweringSpatial Reasoning	CodeCode Available
Unification-based Reconstruction of Multi-hop Explanations for Science Questions	Mar 31, 2020	ClusteringInformation Retrieval	CodeCode Available
Single Sequence Prediction over Reasoning Graphs for Multi-hop QA	Jul 1, 2023	DecoderGraph Neural Network	CodeCode Available
Vision-and-Language Pretraining	Jul 5, 2022	Diversityimage-classification	CodeCode Available
Unified Language Model Pre-training for Natural Language Understanding and Generation	May 8, 2019	Abstractive Text SummarizationDocument Summarization	CodeCode Available
Why do These Match? Explaining the Behavior of Image Similarity Models	May 26, 2019	AttributeGeneral Classification	CodeCode Available
TIMEN: An Open Temporal Expression Normalisation Resource	May 1, 2012	Information RetrievalKnowledge Base Population	CodeCode Available
SciDTB: Discourse Dependency TreeBank for Scientific Abstracts	Jun 10, 2018	ArticlesMachine Translation	CodeCode Available
TimelineKGQA: A Comprehensive Question-Answer Pair Generator for Temporal Knowledge Graphs	Jan 8, 2025	Knowledge GraphsQuestion Answering	CodeCode Available
TimeCausality: Evaluating the Causal Ability in Time Dimension for Vision Language Models	May 21, 2025	Human AgingQuestion Answering	CodeCode Available
Time-Aware Representation Learning for Time-Sensitive Question Answering	Oct 19, 2023	Question AnsweringRepresentation Learning	CodeCode Available
Unified Question Answering in Slovene	Nov 16, 2022	Cross-Lingual TransferDecoder	CodeCode Available
(WhyPHI) Fine-Tuning PHI-3 for Multiple-Choice Question Answering: Methodology, Results, and Challenges	Jan 3, 2025	Multiple-choiceQuestion Answering	CodeCode Available
TIJO: Trigger Inversion with Joint Optimization for Defending Multimodal Backdoored Models	Aug 7, 2023	backdoor defenseobject-detection	CodeCode Available
TIARA: Multi-grained Retrieval for Robust Question Answering over Large Knowledge Bases	Oct 24, 2022	Question AnsweringRetrieval	CodeCode Available
Uniform Complexity for Text Generation	Apr 11, 2022	Machine TranslationQuestion Answering	CodeCode Available
SearchQA: A New Q&A Dataset Augmented with Context from a Search Engine	Apr 18, 2017	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge	Mar 14, 2018	AI2 Reasoning ChallengeARC	CodeCode Available
SciDQA: A Deep Reading Comprehension Dataset over Scientific Papers	Nov 8, 2024	ArticlesQuestion Answering	CodeCode Available
Single and Multi-Hop Question-Answering Datasets for Reticular Chemistry with GPT-4-Turbo	May 3, 2024	BenchmarkingMulti-hop Question Answering	CodeCode Available

Show:10 25 50

← PrevPage 213 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified