Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5701–5750 of 10817 papers

Title	Date	Tasks	Status
Document retrieval and question answering in medical documents. A large-scale corpus challenge.	Sep 1, 2017	Document ClassificationGeneral Classification	—Unverified
Document-level Causal Relation Extraction with Knowledge-guided Binary Question Answering	Oct 7, 2024	Question AnsweringRelation	—Unverified
Leveraging Static Relationships for Intra-Type and Inter-Type Message Passing in Video Question Answering	Apr 3, 2025	Question AnsweringVideo Question Answering	—Unverified
Document Collection Visual Question Answering	Apr 27, 2021	document understandingQuestion Answering	—Unverified
Leveraging Personal Navigation Assistant Systems Using Automated Social Media Traffic Reporting	Apr 21, 2020	Question Answering	—Unverified
Document Attribution: Examining Citation Relationships using Large Language Models	May 9, 2025	Document SummarizationNatural Language Inference	—Unverified
BERT-PersNER: A New Model for Persian Named Entity Recognition	Sep 1, 2021	Active LearningMachine Translation	—Unverified
ANNA: Enhanced Language Representation for Question Answering	Nov 16, 2021	Language ModelingLanguage Modelling	—Unverified
Leveraging Medical Visual Question Answering with Supporting Facts	May 28, 2019	DiversityMedical Visual Question Answering	—Unverified
Leveraging LLMs with Iterative Loop Structure for Enhanced Social Intelligence in Video Question Answering	Mar 27, 2025	Emotion RecognitionQuestion Answering	—Unverified
Document AI: Benchmarks, Models and Applications	Nov 16, 2021	Deep LearningDocument AI	—Unverified
Leveraging Linguistic Structure For Open Domain Information Extraction	Jul 1, 2015	Information RetrievalOpen Information Extraction	—Unverified
DocPrompt: Large-scale continue pretrain for zero-shot and few-shot document question answering	Aug 21, 2023	Question Answering	—Unverified
BERTologyNavigator: Advanced Question Answering with BERT-based Semantics	Jan 17, 2024	Knowledge GraphsNavigate	—Unverified
Leveraging Graph Retrieval-Augmented Generation to Support Learners' Understanding of Knowledge Concepts in MOOCs	May 15, 2025	Knowledge GraphsQuestion Answering	—Unverified
Leveraging Frequent Query Substructures to Generate Formal Queries for Complex Question Answering	Aug 29, 2019	Question AnsweringRelation	—Unverified
Leveraging Extracted Model Adversaries for Improved Black Box Attacks	Oct 30, 2020	Model extractionQuestion Answering	—Unverified
Leveraging Entanglement Entropy for Deep Understanding of Attention Matrix in Text Matching	Sep 25, 2019	Inductive BiasQuestion Answering	—Unverified
DOCMASTER: A Unified Platform for Annotation, Training, & Inference in Document Question-Answering	Mar 30, 2024	Privacy PreservingQuestion Answering	—Unverified
DocGraphLM: Documental Graph Language Model for Information Extraction	Jan 5, 2024	document understandingLanguage Modeling	—Unverified
An Investigation of Machine Translation Evaluation Metrics in Cross-lingual Question Answering	Sep 1, 2015	Cross-Lingual Question AnsweringMachine Translation	—Unverified
A Fast, Reliable, and Secure Programming Language for LLM Agents with Code Actions	Jun 13, 2025	Conformal PredictionQuestion Answering	—Unverified
Leveraging Crowdsourcing for Paraphrase Recognition	Aug 1, 2013	Information RetrievalMachine Translation	—Unverified
Leveraging Commonsense Knowledge on Classifying False News and Determining Checkworthiness of Claims	Aug 8, 2021	Fact CheckingLanguage Modeling	—Unverified
Docforia: A Multilayer Document Model	May 1, 2017	Coreference ResolutionDependency Parsing	—Unverified
Leveraging Chain of Thought towards Empathetic Spoken Dialogue without Corresponding Question-Answering Data	Jan 19, 2025	Dialogue GenerationQuestion Answering	—Unverified
DOCENT: Learning Self-Supervised Entity Representations from Large Document Collections	Feb 26, 2021	Knowledge Base CompletionNatural Language Queries	—Unverified
Let's ViCE! Mimicking Human Cognitive Behavior in Image Generation Evaluation	Jul 18, 2023	Image GenerationQuestion Answering	—Unverified
Let's Reason Formally: Natural-Formal Hybrid Reasoning Enhances LLM's Math Capability	May 29, 2025	MathMathematical Reasoning	—Unverified
Let Sense Bags Do Talking: Cross Lingual Word Semantic Similarity for English and Hindi	Dec 1, 2015	Image RetrievalInformation Retrieval	—Unverified
DocChat: An Information Retrieval Approach for Chatbot Engines Using Unstructured Documents	Aug 1, 2016	ChatbotCommunity Question Answering	—Unverified
Let Me Know What to Ask: Interrogative-Word-Aware Question Generation	Oct 30, 2019	Question AnsweringQuestion Generation	—Unverified
DLS@CU: Sentence Similarity from Word Alignment	Aug 1, 2014	Information RetrievalMachine Translation	—Unverified
DLS@CU: Sentence Similarity from Word Alignment and Semantic Vector Composition	Jun 1, 2015	Information RetrievalMachine Translation	—Unverified
Less Is More: Linear Layers on CLIP Features as Powerful VizWiz Model	Jun 10, 2022	Question AnsweringTask 2	—Unverified
DLS@CU-CORE: A Simple Machine Learning Model of Semantic Textual Similarity	Jun 1, 2013	BIG-bench Machine LearningInformation Retrieval	—Unverified
DLS@CU at SemEval-2016 Task 1: Supervised Models of Sentence Similarity	Jun 1, 2016	Machine TranslationNatural Language Inference	—Unverified
BERT for Question Generation	Oct 1, 2019	Language ModelingLanguage Modelling	—Unverified
An Introductory Survey on Attention Mechanisms in NLP Problems	Nov 12, 2018	Dependency ParsingGeneral Classification	—Unverified
Leveraging Logical Rules in Knowledge Editing: A Cherry on the Top	May 24, 2024	knowledge editingMulti-hop Question Answering	—Unverified
A Factoid Question Answering System Using Answer Pattern Matching	Oct 1, 2013	Question Answering	—Unverified
DLIP: Distilling Language-Image Pre-training	Aug 24, 2023	Image CaptioningImage-text Retrieval	—Unverified
BERTERS: Multimodal Representation Learning for Expert Recommendation System with Transformer	Jun 30, 2020	ArticlesCommunity Question Answering	—Unverified
LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning?	Mar 25, 2025	Autonomous NavigationQuestion Answering	—Unverified
Leveraging Pre-trained Models for Failure Analysis Triplets Generation	Oct 31, 2022	Question AnsweringText Summarization	—Unverified
Leveraging Retrieval-Augmented Generation for Persian University Knowledge Retrieval	Nov 9, 2024	Information RetrievalPrompt Engineering	—Unverified
Lego: Learning to Disentangle and Invert Personalized Concepts Beyond Object Appearance in Text-to-Image Diffusion Models	Nov 23, 2023	Language ModellingLarge Language Model	—Unverified
LegalRAG: A Hybrid RAG System for Multilingual Legal Information Retrieval	Apr 19, 2025	Information RetrievalQuestion Answering	—Unverified
DKPro Keyphrases: Flexible and Reusable Keyphrase Extraction Experiments	Jun 1, 2014	Information RetrievalKeyphrase Extraction	—Unverified
BERT-CoQAC: BERT-based Conversational Question Answering in Context	Apr 23, 2021	Conversational Question AnsweringLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 115 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified