Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10701–10750 of 10817 papers

Title	Date	Tasks	Status
Unlocking Temporal Question Answering for Large Language Models with Tailor-Made Reasoning Logic	May 24, 2023	Logical ReasoningMath	CodeCode Available
NatLan: Native Language Prompting Facilitates Knowledge Elicitation Through Language Trigger Provision and Domain Trigger Retention	Aug 7, 2024	Question Answering	CodeCode Available
Visual Dialogue without Vision or Dialogue	Dec 16, 2018	Question AnsweringVisual Dialog	CodeCode Available
SilVar: Speech Driven Multimodal Model for Reasoning Visual Question Answering and Object Localization	Dec 21, 2024	Image CaptioningMultimodal Reasoning	CodeCode Available
Self-Critique Guided Iterative Reasoning for Multi-hop Question Answering	May 25, 2025	Multi-hop Question AnsweringQuestion Answering	CodeCode Available
Zero-Shot Rationalization by Multi-Task Transfer Learning from Question Answering	Nov 1, 2020	Multi-Task LearningQuestion Answering	CodeCode Available
Unmasking the Limits of Large Language Models: A Systematic Evaluation of Masked Text Processing Ability through MskQA and MskCal	Nov 8, 2024	Question Answering	CodeCode Available
The Limited Impact of Medical Adaptation of Large Language and Vision-Language Models	Nov 13, 2024	Medical Question AnsweringQuestion Answering	CodeCode Available
Unraveling and Mitigating Retriever Inconsistencies in Retrieval-Augmented Large Language Models	May 31, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
XLM-V: Overcoming the Vocabulary Bottleneck in Multilingual Masked Language Models	Jan 25, 2023	Language ModelingLanguage Modelling	CodeCode Available
Stochastic Answer Networks for Machine Reading Comprehension	Dec 10, 2017	Machine Reading ComprehensionQuestion Answering	CodeCode Available
StepSearch: Igniting LLMs Search Ability via Step-Wise Proximal Policy Optimization	May 21, 2025	Question AnsweringReinforcement Learning (RL)	CodeCode Available
What Can Neural Networks Reason About?	May 30, 2019	Question AnsweringVisual Question Answering	CodeCode Available
What Can Secondary Predictions Tell Us? An Exploration on Question-Answering with SQuAD-v2.0	Jun 29, 2022	Question Answering	CodeCode Available
What Can We Learn From Almost a Decade of Food Tweets	Jul 10, 2020	Question AnsweringSentiment Analysis	CodeCode Available
Step by step: a hierarchical framework for multi-hop knowledge graph reasoning with reinforcement learning	Jul 19, 2022	Hierarchical Reinforcement LearningKnowledge Graphs	CodeCode Available
The Interpreter Understands Your Meaning: End-to-end Spoken Language Understanding Aided by Speech Translation	May 16, 2023	Abstractive Text SummarizationContinual Learning	CodeCode Available
STAIR: Spatial-Temporal Reasoning with Auditable Intermediate Results for Video Question Answering	Jan 8, 2024	Question AnsweringVideo Question Answering	CodeCode Available
WikiReading: A Novel Large-scale Language Understanding Task over Wikipedia	Aug 11, 2016	ArticlesDocument Classification	CodeCode Available
LLaVA Steering: Visual Instruction Tuning with 500x Fewer Parameters through Modality Linear Representation-Steering	Dec 16, 2024	In-Context LearningInstruction Following	CodeCode Available
The Illusion of Competence: Evaluating the Effect of Explanations on Users' Mental Models of Visual Question Answering Systems	Jun 27, 2024	Question AnsweringVisual Question Answering	CodeCode Available
The Effect of Masking Strategies on Knowledge Retention by Language Models	Jun 12, 2023	Information RetrievalQuestion Answering	CodeCode Available
Unsupervised Multiple Choices Question Answering: Start Learning from Basic Knowledge	Oct 21, 2020	Question Answering	CodeCode Available
AugTriever: Unsupervised Dense Retrieval and Domain Adaptation by Scalable Data Augmentation	Dec 17, 2022	Data AugmentationDomain Adaptation	CodeCode Available
Unsupervised Dense Retrieval Training with Web Anchors	May 10, 2023	Contrastive LearningQuestion Answering	CodeCode Available
SRQA: Synthetic Reader for Factoid Question Answering	Sep 2, 2020	Question Answering	CodeCode Available
Whatcha lookin' at? DeepLIFTing BERT's Attention in Question Answering	Oct 14, 2019	Question Answering	CodeCode Available
Visually Dehallucinative Instruction Generation	Feb 13, 2024	HallucinationLanguage Modeling	CodeCode Available
Visually Grounded VQA by Lattice-based Retrieval	Nov 15, 2022	Information RetrievalQuestion Answering	CodeCode Available
SqueezeBERT: What can computer vision teach NLP about efficient neural networks?	Jun 19, 2020	Linguistic AcceptabilityNatural Language Inference	CodeCode Available
Unsupervised Improvement of Factual Knowledge in Language Models	Apr 4, 2023	Language ModelingLanguage Modelling	CodeCode Available
Sigma: A dataset for text-to-code semantic parsing with statistical analysis	Apr 5, 2025	Question AnsweringSemantic Parsing	CodeCode Available
Visually Interpretable Subtask Reasoning for Visual Question Answering	May 12, 2025	AttributeObject Recognition	CodeCode Available
The Devil is in the Details: Evaluating Limitations of Transformer-based Methods for Granular Tasks	Nov 2, 2020	Question AnsweringSentiment Analysis	CodeCode Available
What Does My QA Model Know? Devising Controlled Probes using Expert Knowledge	Dec 31, 2019	General KnowledgeKnowledge Graphs	CodeCode Available
Where is the answer? Investigating Positional Bias in Language Model Knowledge Extraction	Feb 16, 2024	DenoisingLanguage Modeling	CodeCode Available
Unsupervised Matching of Data and Text	Dec 16, 2021	Entity ResolutionQuestion Answering	CodeCode Available
The BLue Amazon Brain (BLAB): A Modular Architecture of Services about the Brazilian Maritime Territory	Sep 6, 2022	Question Answering	CodeCode Available
Self-Critical Reasoning for Robust Visual Question Answering	May 24, 2019	Question AnsweringVisual Question Answering	CodeCode Available
SQL Generation via Machine Reading Comprehension	Dec 1, 2020	Machine Reading ComprehensionQuestion Answering	CodeCode Available
SQATIN: Supervised Instruction Tuning Meets Question Answering for Improved Dialogue NLU	Nov 16, 2023	Intent DetectionNatural Language Understanding	CodeCode Available
Unsupervised Natural Language Generation with Denoising Autoencoders	Apr 21, 2018	DenoisingQuestion Answering	CodeCode Available
Siamese Tracking with Lingual Object Constraints	Nov 23, 2020	ObjectObject Tracking	CodeCode Available
Speed Reading: Learning to Read ForBackward via Shuttle	Oct 1, 2018	Document ClassificationDocument Summarization	CodeCode Available
Should We Fine-Tune or RAG? Evaluating Different Techniques to Adapt LLMs for Dialogue	Jun 10, 2024	In-Context LearningQuestion Answering	CodeCode Available
Zero-shot User Intent Detection via Capsule Neural Networks	Sep 2, 2018	Intent DetectionQuestion Answering	CodeCode Available
Unsupervised Question Answering by Cloze Translation	Jun 12, 2019	Natural QuestionsNMT	CodeCode Available
YTCommentQA: Video Question Answerability in Instructional Videos	Jan 30, 2024	Question AnsweringVideo Question Answering	CodeCode Available
Unsupervised Question Answering via Answer Diversifying	Aug 23, 2022	Data AugmentationDenoising	CodeCode Available
Will LLMs Replace the Encoder-Only Models in Temporal Relation Classification?	Oct 14, 2024	In-Context LearningQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 215 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified