Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4201–4250 of 10817 papers

Title	Date	Tasks	Status
From Pixels to Objects: Cubic Visual Attention for Visual Question Answering	Jun 4, 2022	ObjectQuestion Answering	—Unverified
From Parse-Execute to Parse-Execute-Refine: Improving Semantic Parser for Complex Question Answering over Knowledge Base	May 5, 2023	Knowledge Base Question AnsweringQuestion Answering	—Unverified
Coarse-grained decomposition and fine-grained interaction for multi-hop question answering	Jan 15, 2021	Multi-hop Question AnsweringQuestion Answering	—Unverified
From Misleading Queries to Accurate Answers: A Three-Stage Fine-Tuning Method for LLMs	Apr 15, 2025	HallucinationQuestion Answering	—Unverified
Coal Mining Question Answering with LLMs	Oct 3, 2024	Prompt EngineeringQuestion Answering	—Unverified
Ask & Explore: Grounded Question Answering for Curiosity-Driven Exploration	Apr 24, 2021	Question Answering	—Unverified
From Large Language Models to Knowledge Graphs for Biomarker Discovery in Cancer	Oct 12, 2023	ArticlesDecision Making	—Unverified
From Known to the Unknown: Transferring Knowledge to Answer Questions about Novel Visual and Semantic Concepts	Nov 30, 2018	Novel ConceptsQuestion Answering	—Unverified
CNGL: Grading Student Answers by Acts of Translation	Jun 1, 2013	Machine TranslationQuestion Answering	—Unverified
From Isolated Conversations to Hierarchical Schemas: Dynamic Tree Memory Representation for LLMs	Oct 17, 2024	Dialogue UnderstandingManagement	—Unverified
From Instructions to Constraints: Language Model Alignment with Automatic Constraint Verification	Mar 10, 2024	Abstractive Text SummarizationEntity Typing	—Unverified
CMU LiveMedQA at TREC 2017 LiveQA: A Consumer Health Question Answering System	Nov 15, 2017	Answer GenerationGeneral Classification	—Unverified
From Image to Language: A Critical Analysis of Visual Question Answering (VQA) Approaches, Challenges, and Opportunities	Nov 1, 2023	NavigateQuestion Answering	—Unverified
From Images to Textual Prompts: Zero-Shot Visual Question Answering With Frozen Large Language Models	Jan 1, 2023	Question AnsweringVisual Question Answering	—Unverified
From Head to Tail: Towards Balanced Representation in Large Vision-Language Models through Adaptive Data Calibration	Mar 17, 2025	DenoisingQuestion Answering	—Unverified
CMU: Arc-Factored, Discriminative Semantic Dependency Parsing	Aug 1, 2014	ARCDependency Parsing	—Unverified
Ask-EDA: A Design Assistant Empowered by LLM, Hybrid RAG and Abbreviation De-hallucination	Jun 3, 2024	HallucinationQuestion Answering	—Unverified
From 'F' to 'A' on the N.Y. Regents Science Exams: An Overview of the Aristo Project	Sep 4, 2019	Multiple-choiceQuestion Answering	—Unverified
From FiLM to Video: Multi-turn Question Answering with Multi-modal Context	Dec 17, 2018	DecoderQuestion Answering	—Unverified
From Entity Linking to Question Answering -- Recent Progress on Semantic Grounding Tasks	Dec 1, 2016	document understandingEntity Linking	—Unverified
C-MORE: Pretraining to Answer Open-Domain Questions by Consulting Millions of References	Oct 16, 2021	Open-Domain Question AnsweringQuestion Answering	—Unverified
From Easy to Hard: Two-stage Selector and Reader for Multi-hop Question Answering	May 24, 2022	Multi-hop Question AnsweringQuestion Answering	—Unverified
From Easy to Hard: Learning Language-guided Curriculum for Visual Question Answering on Remote Sensing Data	May 6, 2022	Question AnsweringVisual Question Answering	—Unverified
From Data to Commonsense Reasoning: The Use of Large Language Models for Explainable AI	Jul 4, 2024	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	—Unverified
Clustering of Multi-Word Named Entity variants: Multilingual Evaluation	May 1, 2014	ClusteringDocument Classification	—Unverified
A Simple Yet Strong Pipeline for HotpotQA	Apr 14, 2020	Multi-hop Question Answeringnamed-entity-recognition	—Unverified
A Linguistic Study on Relevance Modeling in Information Retrieval	Mar 1, 2021	Information RetrievalNatural Language Understanding	—Unverified
Abstract Meaning Representation of Constructions: The More We Include, the Better the Representation	May 1, 2018	Abstract Meaning RepresentationMachine Translation	—Unverified
From Chat Logs to Collective Insights: Aggregative Question Answering	May 29, 2025	ChatbotQuestion Answering	—Unverified
Clustering Monolingual Vocabularies to Improve Cross-Lingual Generalization	Nov 1, 2021	ClusteringQuestion Answering	—Unverified
From Beginner to Expert: Modeling Medical Knowledge into General LLMs	Dec 2, 2023	Language ModellingLarge Language Model	—Unverified
FriendsQA: Open-Domain Question Answering on TV Show Transcripts	Sep 1, 2019	Open-Domain Question AnsweringQuestion Answering	—Unverified
Clustering Examples in Multi-Dataset Benchmarks with Item Response Theory	May 1, 2022	ClusteringNatural Language Inference	—Unverified
Frequently Asked Questions Retrieval for Croatian Based on Semantic Textual Similarity	Aug 1, 2013	Question AnsweringRetrieval	—Unverified
Cluster-Former: Clustering-based Sparse Transformer for Question Answering	Jan 1, 2021	ClusteringQuestion Answering	—Unverified
FReM: A Flexible Reasoning Mechanism for Balancing Quick and Slow Thinking in Long-Context Question Answering	Mar 29, 2025	Question Answering	—Unverified
Cluster-Former: Clustering-based Sparse Transformer for Long-Range Dependency Encoding	Sep 13, 2020	ClusteringLanguage Modelling	—Unverified
AliMe MKG: A Multi-modal Knowledge Graph for Live-streaming E-commerce	Sep 13, 2021	Multi-modal Knowledge GraphQuestion Answering	—Unverified
freePruner: A Training-free Approach for Large Multimodal Model Acceleration	Nov 23, 2024	QuantizationQuestion Answering	—Unverified
Free Form Medical Visual Question Answering in Radiology	Jan 23, 2024	DiagnosticForm	—Unverified
A Simple Linear Patch Revives Layer-Pruned Large Language Models	May 30, 2025	Knowledge DistillationQuestion Answering	—Unverified
Freebase QA: Information Extraction or Semantic Parsing?	Jun 1, 2014	Open Information ExtractionQuestion Answering	—Unverified
FRAQUE: a FRAme-based QUEstion-answering system for the Public Administration domain	May 1, 2020	Question AnsweringWord Embeddings	—Unverified
CLTR: An End-to-End, Transformer-Based System for Cell-Level Table Retrieval and Table Question Answering	Aug 1, 2021	Question AnsweringRetrieval	—Unverified
A Simple End-to-End Question Answering Model for Product Information	Jul 1, 2018	Answer SelectionQuestion Answering	—Unverified
AliMe KG: Domain Knowledge Graph Construction and Application in E-commerce	Sep 24, 2020	graph constructionQuestion Answering	—Unverified
Agentic Medical Knowledge Graphs Enhance Medical Question Answering: Bridging the Gap Between LLMs and Evolving Medical Knowledge	Feb 18, 2025	Graph GenerationKnowledge Graphs	—Unverified
Framing QA as Building and Ranking Intersentence Answer Justifications	Jun 1, 2017	Multiple-choiceQuestion Answering	—Unverified
Framework for Weakly Supervised Causal Knowledge Extraction from Text	Jan 16, 2022	ManagementNatural Language Inference	—Unverified
Framework for Question-Answering in Sanskrit through Automated Construction of Knowledge Graphs	Oct 11, 2023	Knowledge GraphsQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 85 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified