Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9451–9500 of 10817 papers

Title	Date	Tasks	Status
GenKI: Enhancing Open-Domain Question Answering with Knowledge Integration and Controllable Generation in Large Language Models	May 26, 2025	Open-Domain Question AnsweringPassage Retrieval	CodeCode Available
A Fully Attention-Based Information Retriever	Oct 22, 2018	Question Answering	CodeCode Available
AdvisorQA: Towards Helpful and Harmless Advice-seeking Question Answering with Collective Intelligence	Apr 18, 2024	Question Answering	CodeCode Available
Multilingual Needle in a Haystack: Investigating Long-Context Behavior of Multilingual Large Language Models	Aug 19, 2024	8kInformation Retrieval	CodeCode Available
Multilingual Non-Factoid Question Answering with Answer Paragraph Selection	Aug 20, 2024	ArticlesQuestion Answering	CodeCode Available
Generative Question Refinement with Deep Reinforcement Learning in Retrieval-based QA System	Aug 13, 2019	Deep Reinforcement LearningQuestion Answering	CodeCode Available
BERT with History Answer Embedding for Conversational Question Answering	May 14, 2019	Conversational Question AnsweringConversational Search	CodeCode Available
Question Answering by Reasoning Across Documents with Graph Convolutional Networks	Aug 29, 2018	Question AnsweringReading Comprehension	CodeCode Available
Knowledge of Knowledge: Exploring Known-Unknowns Uncertainty with Large Language Models	May 23, 2023	Known UnknownsOpen-Ended Question Answering	CodeCode Available
Multilingual Question Answering in Low-Resource Settings: A Dzongkha-English Benchmark for Foundation Models	May 24, 2025	Question Answering	CodeCode Available
Are VLMs Really Blind	Oct 29, 2024	Language ModelingLanguage Modelling	CodeCode Available
Multilingual State Space Models for Structured Question Answering in Indic Languages	Feb 1, 2025	Answer GenerationDiversity	CodeCode Available
Question-Answering Dense Video Events	Sep 6, 2024	BenchmarkingQuestion Answering	CodeCode Available
BERTSel: Answer Selection with Pre-trained Models	May 18, 2019	Answer SelectionNatural Language Inference	CodeCode Available
Generative AI Enhanced Financial Risk Management Information Retrieval	Apr 4, 2025	Information RetrievalManagement	CodeCode Available
Adversarial Training with OCR Modality Perturbation for Scene-Text Visual Question Answering	Mar 14, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Knowledge-Retrieval Task-Oriented Dialog Systems with Semi-Supervision	May 22, 2023	Question AnsweringRetrieval	CodeCode Available
Generation with Dynamic Vocabulary	Oct 11, 2024	Language ModelingLanguage Modelling	CodeCode Available
Knowledge Sanitization of Large Language Models	Sep 21, 2023	Question Answering	CodeCode Available
Co-occurrence is not Factual Association in Language Models	Sep 21, 2024	Multi-hop Question AnsweringQuestion Answering	CodeCode Available
ReCoMIF: Reading comprehension based multi-source information fusion network for Chinese spoken language understanding	Aug 1, 2023	Intent DetectionMultiple-choice	CodeCode Available
BERTnesia: Investigating the capture and forgetting of knowledge in BERT	Jun 5, 2021	Knowledge Base CompletionLanguage Modeling	CodeCode Available
GenerationPrograms: Fine-grained Attribution with Executable Programs	Jun 17, 2025	Document SummarizationLong Form Question Answering	CodeCode Available
Perceptual Score: What Data Modalities Does Your Model Perceive?	Oct 27, 2021	Question AnsweringVisual Dialog	CodeCode Available
Generating User-Centred Explanations via Illocutionary Question Answering: From Philosophy to Interfaces	Oct 2, 2021	Disease PredictionExplainable Artificial Intelligence (XAI)	CodeCode Available
Generating Biomedical Question Answering Corpora from Q&A forums	Feb 6, 2020	ArticlesQuestion Answering	CodeCode Available
Generating Context-Aware Natural Answers for Questions in 3D Scenes	Oct 30, 2023	Question AnsweringSentence	CodeCode Available
Question Answering for Privacy Policies: Combining Computational and Legal Perspectives	Nov 3, 2019	Question Answering	CodeCode Available
Contextual Embeddings for Arabic-English Code-Switched Data	Dec 1, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available
Adversarial Multi-lingual Neural Relation Extraction	Aug 1, 2018	DiversityQuestion Answering	CodeCode Available
Contextual embedding and model weighting by fusing domain knowledge on Biomedical Question Answering	Jun 26, 2022	Cloze TestMachine Reading Comprehension	CodeCode Available
KOFFVQA: An Objectively Evaluated Free-form VQA Benchmark for Large Vision-Language Models in the Korean Language	Mar 31, 2025	FormQuestion Answering	CodeCode Available
Contextual Dropout: An Efficient Sample-Dependent Dropout Module	Mar 6, 2021	image-classificationImage Classification	CodeCode Available
Are Visual-Linguistic Models Commonsense Knowledge Bases?	Oct 1, 2022	Natural Language UnderstandingQuestion Answering	CodeCode Available
Konstruktor: A Strong Baseline for Simple Knowledge Graph Question Answering	Sep 24, 2024	Entity LinkingGraph Question Answering	CodeCode Available
Generalizing Visual Question Answering from Synthetic to Human-Written Questions via a Chain of QA with a Large Language Model	Jan 12, 2024	Language ModelingLanguage Modelling	CodeCode Available
Recommending Themes for Ad Creative Design via Visual-Linguistic Representations	Jan 20, 2020	Question AnsweringRecommendation Systems	CodeCode Available
An empirical analysis of existing systems and datasets toward general simple question answering	Dec 1, 2020	Natural Language UnderstandingQuestion Answering	CodeCode Available
Downstream Trade-offs of a Family of Text Watermarks	Nov 16, 2023	FormLanguage Modelling	CodeCode Available
Same same, but different: Compositionality of paraphrase granularity levels	Sep 1, 2017	Machine TranslationQuestion Answering	CodeCode Available
Ancient Wisdom, Modern Tools: Exploring Retrieval-Augmented LLMs for Ancient Indian Philosophy	Aug 21, 2024	Information RetrievalLong Form Question Answering	CodeCode Available
General Greedy De-bias Learning	Dec 20, 2021	image-classificationImage Classification	CodeCode Available
GeneQuery: A General QA-based Framework for Spatial Gene Expression Predictions from Histology Images	Nov 27, 2024	Question Answeringwhole slide images	CodeCode Available
KRAUTS: A German Temporally Annotated News Corpus	May 1, 2018	Information RetrievalQuestion Answering	CodeCode Available
A Benchmark for Long-Form Medical Question Answering	Nov 14, 2024	Answer GenerationForm	CodeCode Available
Question Answering on Freebase via Relation Extraction and Textual Evidence	Mar 3, 2016	Question AnsweringRelation	CodeCode Available
BERTnesia: Investigating the capture and forgetting of knowledge in BERT	Oct 19, 2020	Knowledge Base CompletionNER	CodeCode Available
Context Transformer with Stacked Pointer Networks for Conversational Question Answering over Knowledge Graphs	Mar 13, 2021	Conversational Question AnsweringKnowledge Graphs	CodeCode Available
Adapting Lightweight Vision Language Models for Radiological Visual Question Answering	Jun 17, 2025	DiagnosticQuestion Answering	CodeCode Available
Multimodal Explanations: Justifying Decisions and Pointing to the Evidence	Feb 15, 2018	Activity RecognitionExplainable Models	CodeCode Available

Show:10 25 50

← PrevPage 190 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified