Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9451–9475 of 10817 papers

Title	Date	Tasks	Status
Multilingual Needle in a Haystack: Investigating Long-Context Behavior of Multilingual Large Language Models	Aug 19, 2024	8kInformation Retrieval	CodeCode Available
Multilingual Non-Factoid Question Answering with Answer Paragraph Selection	Aug 20, 2024	ArticlesQuestion Answering	CodeCode Available
Are You Talking to a Machine? Dataset and Methods for Multilingual Image Question Answering	May 21, 2015	Question AnsweringSentence	CodeCode Available
GenKI: Enhancing Open-Domain Question Answering with Knowledge Integration and Controllable Generation in Large Language Models	May 26, 2025	Open-Domain Question AnsweringPassage Retrieval	CodeCode Available
Question-Answering Dense Video Events	Sep 6, 2024	BenchmarkingQuestion Answering	CodeCode Available
Multilingual Question Answering in Low-Resource Settings: A Dzongkha-English Benchmark for Foundation Models	May 24, 2025	Question Answering	CodeCode Available
Knowledge of Knowledge: Exploring Known-Unknowns Uncertainty with Large Language Models	May 23, 2023	Known UnknownsOpen-Ended Question Answering	CodeCode Available
Adversarial Training with OCR Modality Perturbation for Scene-Text Visual Question Answering	Mar 14, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Multilingual State Space Models for Structured Question Answering in Indic Languages	Feb 1, 2025	Answer GenerationDiversity	CodeCode Available
BERT with History Answer Embedding for Conversational Question Answering	May 14, 2019	Conversational Question AnsweringConversational Search	CodeCode Available
ReCoMIF: Reading comprehension based multi-source information fusion network for Chinese spoken language understanding	Aug 1, 2023	Intent DetectionMultiple-choice	CodeCode Available
A Benchmark for Long-Form Medical Question Answering	Nov 14, 2024	Answer GenerationForm	CodeCode Available
Generative Question Refinement with Deep Reinforcement Learning in Retrieval-based QA System	Aug 13, 2019	Deep Reinforcement LearningQuestion Answering	CodeCode Available
Question Answering for Privacy Policies: Combining Computational and Legal Perspectives	Nov 3, 2019	Question Answering	CodeCode Available
Knowledge-Retrieval Task-Oriented Dialog Systems with Semi-Supervision	May 22, 2023	Question AnsweringRetrieval	CodeCode Available
Generative AI Enhanced Financial Risk Management Information Retrieval	Apr 4, 2025	Information RetrievalManagement	CodeCode Available
Knowledge Sanitization of Large Language Models	Sep 21, 2023	Question Answering	CodeCode Available
BERTSel: Answer Selection with Pre-trained Models	May 18, 2019	Answer SelectionNatural Language Inference	CodeCode Available
Perceptual Score: What Data Modalities Does Your Model Perceive?	Oct 27, 2021	Question AnsweringVisual Dialog	CodeCode Available
Recommending Themes for Ad Creative Design via Visual-Linguistic Representations	Jan 20, 2020	Question AnsweringRecommendation Systems	CodeCode Available
Generation with Dynamic Vocabulary	Oct 11, 2024	Language ModelingLanguage Modelling	CodeCode Available
Are VLMs Really Blind	Oct 29, 2024	Language ModelingLanguage Modelling	CodeCode Available
GenerationPrograms: Fine-grained Attribution with Executable Programs	Jun 17, 2025	Document SummarizationLong Form Question Answering	CodeCode Available
Generating User-Centred Explanations via Illocutionary Question Answering: From Philosophy to Interfaces	Oct 2, 2021	Disease PredictionExplainable Artificial Intelligence (XAI)	CodeCode Available
Generating Biomedical Question Answering Corpora from Q&A forums	Feb 6, 2020	ArticlesQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 379 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified