Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8101–8150 of 10817 papers

Title	Date	Tasks	Status
Abstract Meaning Representation of Constructions: The More We Include, the Better the Representation	May 1, 2018	Abstract Meaning RepresentationMachine Translation	—Unverified
Reference-free Hallucination Detection for Large Vision-Language Models	Aug 11, 2024	HallucinationQuestion Answering	—Unverified
Rethinking Information Synthesis in Multimodal Question Answering A Multi-Agent Perspective	May 27, 2025	Language ModelingLanguage Modelling	—Unverified
From Parse-Execute to Parse-Execute-Refine: Improving Semantic Parser for Complex Question Answering over Knowledge Base	May 5, 2023	Knowledge Base Question AnsweringQuestion Answering	—Unverified
Rethinking Multi-Modal Alignment in Video Question Answering from Feature and Sample Perspectives	Apr 25, 2022	Question AnsweringVideo Question Answering	—Unverified
Coal Mining Question Answering with LLMs	Oct 3, 2024	Prompt EngineeringQuestion Answering	—Unverified
REFIND: Retrieval-Augmented Factuality Hallucination Detection in Large Language Models	Feb 19, 2025	HallucinationLanguage Modeling	—Unverified
REFINE on Scarce Data: Retrieval Enhancement through Fine-Tuning via Model Fusion of Embedding Models	Oct 16, 2024	Data AugmentationLanguage Modeling	—Unverified
Refining Implicit Argument Annotation for UCCA	May 26, 2020	Coreference ResolutionNatural Language Understanding	—Unverified
Assessing The Potential Of Mid-Sized Language Models For Clinical QA	Apr 24, 2024	MedQAQuestion Answering	—Unverified
GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks	Jun 14, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified
Comparative Analysis of Retrieval Systems in the Real World	May 3, 2024	Information RetrievalQuestion Answering	—Unverified
Generating Question Relevant Captions to Aid Visual Question Answering	Jun 3, 2019	General KnowledgeImage Captioning	—Unverified
GLaM: Efficient Scaling of Language Models with Mixture-of-Experts	Dec 13, 2021	Common Sense ReasoningIn-Context Learning	—Unverified
Giving BERT a Calculator: Finding Operations and Arguments with Reading Comprehension	Aug 31, 2019	MathQuestion Answering	—Unverified
From Questions to Insightful Answers: Building an Informed Chatbot for University Resources	May 13, 2024	ChatbotLanguage Modeling	—Unverified
Regularizing Attention Networks for Anomaly Detection in Visual Question Answering	Sep 21, 2020	Anomaly DetectionQuestion Answering	—Unverified
Rehearsing Answers to Probable Questions with Perspective-Taking	Sep 27, 2024	Common Sense ReasoningKnowledge Graphs	—Unverified
Comparative Analysis of Open-Source Language Models in Summarizing Medical Text Data	May 25, 2024	Question Answering	—Unverified
Comparative Analysis of Neural QA models on SQuAD	Jun 18, 2018	Information RetrievalQuestion Answering	—Unverified
GiVE: Guiding Visual Encoder to Perceive Overlooked Information	Oct 26, 2024	ObjectQuestion Answering	—Unverified
Reinforced Iterative Knowledge Distillation for Cross-Lingual Named Entity Recognition	Jun 1, 2021	Cross-Lingual NERKnowledge Distillation	—Unverified
Assessing the performance of Olelo, a real-time biomedical question answering application	Aug 1, 2017	Document SummarizationInformation Retrieval	—Unverified
Reinforced Multi-task Approach for Multi-hop Question Generation	Apr 5, 2020	Multi-hop Question AnsweringQuestion Answering	—Unverified
Reinforced Question Rewriting for Conversational Question Answering	Oct 27, 2022	Conversational Question AnsweringQuestion Answering	—Unverified
Results of the fifth edition of the BioASQ Challenge	Aug 1, 2017	Information RetrievalQuestion Answering	—Unverified
Results of the seventh edition of the BioASQ Challenge	Jun 16, 2020	Question Answering	—Unverified
GigaPevt: Multimodal Medical Assistant	Feb 26, 2024	Question Answering	—Unverified
Reinforcement Learning for Optimizing RAG for Domain Chatbots	Jan 10, 2024	ChatbotQuestion Answering	—Unverified
Reinforcement learning for question answering in programming domain using public community scoring as a human feedback	Jan 19, 2024	Community Question AnsweringQuestion Answering	—Unverified
Comparative Analysis of CHATGPT and the evolution of language models	Mar 28, 2023	Machine TranslationQuestion Answering	—Unverified
Reinforcement Learning of Question-Answering Dialogue Policies for Virtual Museum Guides	Jul 1, 2012	Dialogue ManagementQuestion Answering	—Unverified
Reinforcement Learning of Two-Issue Negotiation Dialogue Policies	Aug 1, 2013	Question Answeringreinforcement-learning	—Unverified
Get Your Model Puzzled: Introducing Crossword-Solving as a New NLP Benchmark	Nov 16, 2021	Natural Language UnderstandingOpen-Domain Question Answering	—Unverified
Legal Question-Answering in the Indian Context: Efficacy, Challenges, and Potential of Modern AI Models	Sep 26, 2023	Natural Language QueriesQuestion Answering	—Unverified
Reinforcing Question Answering Agents with Minimalist Policy Gradient Optimization	May 20, 2025	HallucinationIn-Context Learning	—Unverified
From text to multimodal: a survey of adversarial example generation in question answering systems	Dec 26, 2023	Question AnsweringQuestion Generation	—Unverified
Reka Core, Flash, and Edge: A Series of Powerful Multimodal Language Models	Apr 18, 2024	GSM8KMMLU	—Unverified
Relational Graph Convolutional Neural Networks for Multihop Reasoning: A Comparative Study	Oct 12, 2022	Question Answering	—Unverified
Relational Graph Representation Learning for Open-Domain Question Answering	Oct 18, 2019	Graph Neural NetworkGraph Representation Learning	—Unverified
RPT: Relational Pre-trained Transformer Is Almost All You Need towards Democratizing Data Preparation	Dec 4, 2020	AllDecoder	—Unverified
Knowledge Graph Contrastive Learning Based on Relation-Symmetrical Structure	Nov 19, 2022	Contrastive LearningGraph Embedding	—Unverified
Assessing SRL Frameworks with Automatic Training Data Expansion	Apr 1, 2017	Question AnsweringSemantic Role Labeling	—Unverified
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified
Get Large Language Models Ready to Speak: A Late-fusion Approach for Speech Generation	Oct 27, 2024	parameter-efficient fine-tuningQuestion Answering	—Unverified
GermanQuAD and GermanDPR: Improving Non-English Question Answering and Passage Retrieval	Apr 26, 2021	Passage RetrievalQuestion Answering	—Unverified
Compact Tensor Pooling for Visual Question Answering	Jun 20, 2017	Question AnsweringVisual Question Answering	—Unverified
Relation/Entity-Centric Reading Comprehension	Aug 27, 2020	Question AnsweringReading Comprehension	—Unverified
Relation Classification as Two-way Span-Prediction	Oct 9, 2020	ClassificationGeneral Classification	—Unverified
German FinBERT: A German Pre-trained Language Model	Nov 15, 2023	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 163 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified