Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4551–4600 of 10817 papers

Title	Date	Tasks	Status
Integrating Question Classification and Deep Learning for improved Answer Selection	Aug 1, 2018	Answer SelectionClassification	—Unverified
An Empirical Comparison of Question Classification Methods for Question Answering Systems	May 1, 2020	ClassificationGeneral Classification	—Unverified
Debating for Better Reasoning: An Unsupervised Multimodal Approach	May 20, 2025	Question AnsweringVisual Question Answering	—Unverified
Automatic Noun Compound Interpretation using Deep Neural Networks and Word Embeddings	Apr 1, 2015	Information RetrievalMachine Translation	—Unverified
Advancing Egocentric Video Question Answering with Multimodal Large Language Models	Apr 6, 2025	Object RecognitionQuestion Answering	—Unverified
Answering Any-hop Open-domain Questions with Iterative Document Reranking	Sep 16, 2020	Multi-hop Question AnsweringNatural Questions	—Unverified
Automatic lexical semantic classification of nouns	May 1, 2012	ClassificationEntity Typing	—Unverified
DDRprog: A CLEVR Differentiable Dynamic Reasoning Programmer	Mar 30, 2018	Question AnsweringVisual Question Answering	—Unverified
Automatic Keyword Extraction on Twitter	Jul 1, 2015	Information RetrievalKeyword Extraction	—Unverified
An Empirical Comparison of LM-based Question and Answer Generation Methods	May 26, 2023	Answer GenerationData Augmentation	—Unverified
A Comparative and Experimental Study on Automatic Question Answering Systems and its Robustness against Word Jumbling	Nov 27, 2023	Answer GenerationQuestion-Answer-Generation	—Unverified
Integrating Object Detection Modality into Visual Language Model for Enhanced Autonomous Driving Agent	Nov 8, 2024	Autonomous DrivingLanguage Modeling	—Unverified
Integrating Question Rewrites in Conversational Question Answering: A Reinforcement Learning Approach	May 1, 2022	Conversational Question AnsweringQuestion Answering	—Unverified
Automatic Interpretation of the English Possessive	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
DC-BERT: Decoupling Question and Document for Efficient Contextual Encoding	Feb 28, 2020	Natural QuestionsOpen-Domain Question Answering	—Unverified
An Empirical Assessment of Contemporary Online Media in Ad-Hoc Corpus Creation for Social Events	Oct 1, 2013	Information RetrievalMachine Translation	—Unverified
DBpedia Domains: augmenting DBpedia with domain information	May 1, 2014	ClusteringOpen-Domain Question Answering	—Unverified
DBpedia: A Multilingual Cross-domain Knowledge Base	May 1, 2012	Entity LinkingQuestion Answering	—Unverified
Automatic Identifying Entity Type in Linked Data	Oct 1, 2016	Entity LinkingQuestion Answering	—Unverified
Integrating Large Language Models with Graph-based Reasoning for Conversational Question Answering	Jun 14, 2024	Conversational Question AnsweringKnowledge Graphs	—Unverified
ReEval: Automatic Hallucination Evaluation for Retrieval-Augmented Large Language Models via Transferable Adversarial Attacks	Oct 19, 2023	HallucinationHallucination Evaluation	—Unverified
Davidsonian Scene Graph: Improving Reliability in Fine-grained Evaluation for Text-to-Image Generation	Oct 27, 2023	Image GenerationQuestion Answering	—Unverified
A Combined Pattern-based and Distributional Approach for Automatic Hypernym Detection in Dutch.	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Dataset vs Reality: Understanding Model Performance from the Perspective of Information Need	Dec 6, 2022	Image CaptioningInformation Retrieval	—Unverified
Datasets for Multilingual Answer Sentence Selection	Jun 14, 2024	Language ModelingLanguage Modelling	—Unverified
Integrating Knowledge and Reasoning in Image Understanding	Jun 24, 2019	Object RecognitionQuestion Answering	—Unverified
Integrating Location, Visibility, and Question-Answering in a Spoken Dialogue System for Pedestrian City Exploration	Jul 1, 2012	Question Answering	—Unverified
Dataset Bias Mitigation in Multiple-Choice Visual Question Answering and Beyond	Oct 23, 2023	counterfactualMultiple-choice	—Unverified
Automatic Feature Engineering for Answer Selection and Extraction	Oct 1, 2013	Answer SelectionFeature Engineering	—Unverified
(2.5+1)D Spatio-Temporal Scene Graphs for Video Question Answering	Feb 18, 2022	Question AnsweringSpatio-temporal Scene Graphs	—Unverified
An Emotional Comfort Framework for Improving User Satisfaction in E-Commerce Customer Service Chatbots	Jun 1, 2021	Answer SelectionEmotion Classification	—Unverified
Advancing Chinese biomedical text mining with community challenges	Mar 7, 2024	AttributeAttribute Extraction	—Unverified
Integrating Frequency-Domain Representations with Low-Rank Adaptation in Vision-Language Models	Mar 8, 2025	Caption GenerationQuestion Answering	—Unverified
Data Quality Estimation Framework for Faster Tax Code Classification	May 1, 2022	AttributeAttribute Value Extraction	—Unverified
Automatic Evaluation vs. User Preference in Neural Textual QuestionAnswering over COVID-19 Scientific Literature	Dec 1, 2020	Information RetrievalQuestion Answering	—Unverified
Data Metabolism: An Efficient Data Design Schema For Vision Language Model	Apr 10, 2025	Language ModelingLanguage Modelling	—Unverified
PlotQA: Reasoning over Scientific Plots	Sep 3, 2019	Chart Question AnsweringQuestion Answering	—Unverified
Automatic Evaluation of Summary Using Textual Entailment	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Integrating Hierarchical Semantic into Iterative Generation Model for Entailment Tree Explanation	Sep 26, 2024	Question Answering	—Unverified
Integrating Multi-Head Convolutional Encoders with Cross-Attention for Improved SPARQL Query Translation	Aug 24, 2024	Graph Question AnsweringMachine Translation	—Unverified
Integrating SPARQL and LLMs for Question Answering over Scholarly Data Sources	Sep 11, 2024	Extractive Question-AnsweringQuestion Answering	—Unverified
Biomedical Evidence Generation Engine	Nov 11, 2019	Information RetrievalQuestion Answering	—Unverified
Dynamic Clue Bottlenecks: Towards Interpretable-by-Design Visual Question Answering	May 24, 2023	Question AnsweringVisual Question Answering	—Unverified
Joint Semantics and Data-Driven Path Representation for Knowledge Graph Inference	Oct 6, 2020	Link PredictionQuestion Answering	—Unverified
DataFrame QA: A Universal LLM Framework on DataFrame Question Answering Without Data Exposure	Jan 27, 2024	Information RetrievalQuestion Answering	—Unverified
Data-efficient Meta-models for Evaluation of Context-based Questions and Answers in LLMs	May 29, 2025	Dimensionality ReductionHallucination	—Unverified
Data-Efficient French Language Modeling with CamemBERTa	Jun 2, 2023	Dependency ParsingFLUE	—Unverified
Data-Efficient Autoregressive Document Retrieval for Fact Verification	Nov 17, 2022	ArticlesFact Verification	—Unverified
Automatic Dataset Generation for Knowledge Intensive Question Answering Tasks	May 20, 2025	Dataset GenerationQuestion Answering	—Unverified
Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction	Apr 24, 2025	Conformal PredictionHallucination	—Unverified

Show:10 25 50

← PrevPage 92 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified