Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7551–7600 of 10817 papers

Title	Date	Tasks	Status
Comprehensive Evaluation for a Large Scale Knowledge Graph Question Answering Service	Jan 28, 2025	Graph Question AnsweringNatural Language Queries	—Unverified
Private LoRA Fine-tuning of Open-Source LLMs with Homomorphic Encryption	May 12, 2025	GPUKnowledge Base Question Answering	—Unverified
FairSteer: Inference Time Debiasing for LLMs with Dynamic Activation Steering	Apr 20, 2025	counterfactualFairness	—Unverified
Probabilistic Databases of Universal Schema	Jun 1, 2012	Collaborative FilteringQuestion Answering	—Unverified
ChatGPT as a Factual Inconsistency Evaluator for Text Summarization	Mar 27, 2023	Abstractive Text SummarizationNatural Language Inference	—Unverified
Probabilistic Inference for Cold Start Knowledge Base Population with Prior World Knowledge	Apr 1, 2017	Common Sense ReasoningEntity Linking	—Unverified
Probabilistic Neural Programs	Dec 2, 2016	Program inductionQuestion Answering	—Unverified
Probabilistic Neural-symbolic Models for Interpretable Visual Question Answering	Feb 21, 2019	counterfactualQuestion Answering	—Unverified
A Strong Lexical Matching Method for the Machine Comprehension Test	Sep 1, 2015	Common Sense ReasoningCoreference Resolution	—Unverified
GreaseLM: Graph REASoning Enhanced Language Models	Sep 29, 2021	Knowledge GraphsMedical Question Answering	—Unverified
Comprehensive Audio Query Handling System with Integrated Expert Models and Contextual Understanding	Dec 5, 2024	Audio GenerationAutomatic Speech Recognition	—Unverified
Probing Difficulty and Discrimination of Natural Language Questions With Item Response Theory	Nov 16, 2021	Active LearningQuestion Answering	—Unverified
GRASS: Unified Generation Model for Speech-to-Semantic Tasks	Sep 6, 2023	named-entity-recognitionNamed Entity Recognition	—Unverified
GraspCoT: Integrating Physical Property Reasoning for 6-DoF Grasping under Flexible Language Instructions	Mar 20, 2025	Question Answering	—Unverified
Probing Inter-modality: Visual Parsing with Self-Attention for Vision-Language Pre-training	Jun 25, 2021	Image-text RetrievalQuestion Answering	—Unverified
Probing Inter-modality: Visual Parsing with Self-Attention for Vision-and-Language Pre-training	May 21, 2021	Question AnsweringRelation	—Unverified
Comprehensive and Practical Evaluation of Retrieval-Augmented Generation Systems for Medical Question Answering	Nov 14, 2024	Medical Question AnsweringMisinformation	—Unverified
Faithful Temporal Question Answering over Heterogeneous Sources	Feb 23, 2024	Question Answering	—Unverified
A strong baseline for question relevancy ranking	Aug 27, 2018	Community Question AnsweringFeature Engineering	—Unverified
Probing the Role of Positional Information in Vision-Language Models	May 17, 2023	Contrastive LearningImage-text matching	—Unverified
A Method to Generate a Machine-Labeled Data for Biomedical Named Entity Recognition with Various Sub-Domains	Nov 1, 2017	BIG-bench Machine Learningnamed-entity-recognition	—Unverified
Problematic Cases in the Annotation of Negation in Spanish	Dec 1, 2016	NegationNegation Detection	—Unverified
GraspCorrect: Robotic Grasp Correction via Vision-Language Model-Guided Feedback	Mar 19, 2025	Language ModelingLanguage Modelling	—Unverified
ProblemSolver at SemEval-2019 Task 10: Sequence-to-Sequence Learning and Expression Trees	Jun 1, 2019	MathQuestion Answering	—Unverified
Comprehension Based Question Answering using Bloom’s Taxonomy	Aug 1, 2021	Common Sense ReasoningQuestion Answering	—Unverified
Comprehension Based Question Answering using Bloom's Taxonomy	Jun 8, 2021	Common Sense ReasoningQuestion Answering	—Unverified
Proceedings of the 2nd Workshop on Machine Reading for Question Answering	Nov 1, 2019	Question AnsweringReading Comprehension	—Unverified
Proceedings of the 6th BioASQ Workshop A challenge on large-scale biomedical semantic indexing and question answering	Nov 1, 2018	Question Answering	—Unverified
AstroLLaVA: towards the unification of astronomical data and natural language	Apr 11, 2025	AstronomyImage Captioning	—Unverified
Proceedings of the Joint Workshop on Bibliometric-enhanced Information Retrieval and Natural Language Processing for Digital Libraries (BIRNDL)	Jun 1, 2016	Information RetrievalQuestion Answering	—Unverified
Proceedings of the Open Knowledge Base and Question Answering Workshop (OKBQA 2016)	Dec 1, 2016	Question Answering	—Unverified
Proceedings of the Workshop on Human-Computer Question Answering	Jun 1, 2016	Question Answering	—Unverified
Proceedings of the Workshop on Machine Reading for Question Answering	Jul 1, 2018	Question AnsweringReading Comprehension	—Unverified
Proceedings of the Workshop on Question Answering for Complex Domains	Dec 1, 2012	Question Answering	—Unverified
FAQ-based Question Answering via Knowledge Anchors	Nov 14, 2019	graph constructionKnowledge Graphs	—Unverified
ProcTag: Process Tagging for Assessing the Efficacy of Document Instruction Data	Jul 17, 2024	Question AnsweringVisual Question Answering	—Unverified
FAQ-based Question Answering via Word Alignment	Jul 9, 2015	Learning-To-RankQuestion Answering	—Unverified
Product Question Answering in E-Commerce: A Survey	Feb 16, 2023	Question AnsweringSurvey	—Unverified
Programming Language Agnostic Mining of Code and Language Pairs with Sequence Labeling Based Question Answering	Mar 21, 2022	Question Answering	—Unverified
Program Synthesis Benchmark for Visual Programming in XLogoOnline Environment	Jun 17, 2024	Logical ReasoningMath	—Unverified
Progressive Attention Memory Network for Movie Story Question Answering	Apr 18, 2019	Question AnsweringVideo Story QA	—Unverified
Graph-Structured Representations for Visual Question Answering	Sep 19, 2016	Multiple-choiceQuestion Answering	—Unverified
Progressive Evidence Refinement for Open-domain Multimodal Retrieval Question Answering	Oct 15, 2023	Contrastive LearningLogical Sequence	—Unverified
Graph Relation Transformer: Incorporating pairwise object features into the Transformer architecture	Nov 11, 2021	Graph AttentionQuestion Answering	—Unverified
Compound Type Identification in Sanskrit: What Roles do the Corpus and Grammar Play?	Dec 1, 2016	ClassificationGeneral Classification	—Unverified
FashionVQA: A Domain-Specific Visual Question Answering System	Aug 24, 2022	Question AnsweringVisual Question Answering	—Unverified
Bilinear Graph Networks for Visual Question Answering	Jul 23, 2019	Question AnsweringVisual Question Answering	—Unverified
Projection-based Annotation of a Polish Dependency Treebank	May 1, 2014	ARCDependency Parsing	—Unverified
Graph Reasoning for Question Answering with Triplet Retrieval	May 30, 2023	Knowledge GraphsQuestion Answering	—Unverified
Compound Tokens: Channel Fusion for Vision-Language Representation Learning	Dec 2, 2022	DecoderLanguage Modeling	—Unverified

Show:10 25 50

← PrevPage 152 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified