Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10701–10725 of 10817 papers

Title	Date	Tasks	Status
Unlocking Temporal Question Answering for Large Language Models with Tailor-Made Reasoning Logic	May 24, 2023	Logical ReasoningMath	CodeCode Available
NatLan: Native Language Prompting Facilitates Knowledge Elicitation Through Language Trigger Provision and Domain Trigger Retention	Aug 7, 2024	Question Answering	CodeCode Available
Visual Dialogue without Vision or Dialogue	Dec 16, 2018	Question AnsweringVisual Dialog	CodeCode Available
SilVar: Speech Driven Multimodal Model for Reasoning Visual Question Answering and Object Localization	Dec 21, 2024	Image CaptioningMultimodal Reasoning	CodeCode Available
Self-Critique Guided Iterative Reasoning for Multi-hop Question Answering	May 25, 2025	Multi-hop Question AnsweringQuestion Answering	CodeCode Available
Zero-Shot Rationalization by Multi-Task Transfer Learning from Question Answering	Nov 1, 2020	Multi-Task LearningQuestion Answering	CodeCode Available
Unmasking the Limits of Large Language Models: A Systematic Evaluation of Masked Text Processing Ability through MskQA and MskCal	Nov 8, 2024	Question Answering	CodeCode Available
The Limited Impact of Medical Adaptation of Large Language and Vision-Language Models	Nov 13, 2024	Medical Question AnsweringQuestion Answering	CodeCode Available
Unraveling and Mitigating Retriever Inconsistencies in Retrieval-Augmented Large Language Models	May 31, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
XLM-V: Overcoming the Vocabulary Bottleneck in Multilingual Masked Language Models	Jan 25, 2023	Language ModelingLanguage Modelling	CodeCode Available
Stochastic Answer Networks for Machine Reading Comprehension	Dec 10, 2017	Machine Reading ComprehensionQuestion Answering	CodeCode Available
StepSearch: Igniting LLMs Search Ability via Step-Wise Proximal Policy Optimization	May 21, 2025	Question AnsweringReinforcement Learning (RL)	CodeCode Available
What Can Neural Networks Reason About?	May 30, 2019	Question AnsweringVisual Question Answering	CodeCode Available
What Can Secondary Predictions Tell Us? An Exploration on Question-Answering with SQuAD-v2.0	Jun 29, 2022	Question Answering	CodeCode Available
What Can We Learn From Almost a Decade of Food Tweets	Jul 10, 2020	Question AnsweringSentiment Analysis	CodeCode Available
Step by step: a hierarchical framework for multi-hop knowledge graph reasoning with reinforcement learning	Jul 19, 2022	Hierarchical Reinforcement LearningKnowledge Graphs	CodeCode Available
The Interpreter Understands Your Meaning: End-to-end Spoken Language Understanding Aided by Speech Translation	May 16, 2023	Abstractive Text SummarizationContinual Learning	CodeCode Available
STAIR: Spatial-Temporal Reasoning with Auditable Intermediate Results for Video Question Answering	Jan 8, 2024	Question AnsweringVideo Question Answering	CodeCode Available
WikiReading: A Novel Large-scale Language Understanding Task over Wikipedia	Aug 11, 2016	ArticlesDocument Classification	CodeCode Available
LLaVA Steering: Visual Instruction Tuning with 500x Fewer Parameters through Modality Linear Representation-Steering	Dec 16, 2024	In-Context LearningInstruction Following	CodeCode Available
The Illusion of Competence: Evaluating the Effect of Explanations on Users' Mental Models of Visual Question Answering Systems	Jun 27, 2024	Question AnsweringVisual Question Answering	CodeCode Available
The Effect of Masking Strategies on Knowledge Retention by Language Models	Jun 12, 2023	Information RetrievalQuestion Answering	CodeCode Available
Unsupervised Multiple Choices Question Answering: Start Learning from Basic Knowledge	Oct 21, 2020	Question Answering	CodeCode Available
AugTriever: Unsupervised Dense Retrieval and Domain Adaptation by Scalable Data Augmentation	Dec 17, 2022	Data AugmentationDomain Adaptation	CodeCode Available
Unsupervised Dense Retrieval Training with Web Anchors	May 10, 2023	Contrastive LearningQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 429 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified