Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7501–7550 of 10817 papers

Title	Date	Tasks	Status
PlotQA: Reasoning over Scientific Plots	Sep 3, 2019	Chart Question AnsweringQuestion Answering	—Unverified
Predicting Helpful Posts in Open-Ended Discussion Forums: A Neural Architecture	Jun 1, 2019	Community Question AnsweringQuestion Answering	—Unverified
Automatic Evaluation of Summary Using Textual Entailment	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
An Emotional Comfort Framework for Improving User Satisfaction in E-Commerce Customer Service Chatbots	Jun 1, 2021	Answer SelectionEmotion Classification	—Unverified
Predicting Question Quality on StackOverflow with Neural Networks	Apr 20, 2024	Question Answering	—Unverified
Predicting Relative Depth between Objects from Semantic Features	Jan 12, 2021	Question AnsweringVisual Question Answering	—Unverified
Predicting Structures in NLP: Constrained Conditional Models and Integer Linear Programming in NLP	Jun 1, 2012	Dependency ParsingFeature Engineering	—Unverified
Advancing Chinese biomedical text mining with community challenges	Mar 7, 2024	AttributeAttribute Extraction	—Unverified
A Combined Pattern-based and Distributional Approach for Automatic Hypernym Detection in Dutch.	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Predicting the Difficulty of Multiple Choice Questions in a High-stakes Medical Exam	Aug 1, 2019	Multiple-choiceQuestion Answering	—Unverified
Predicting the impact of dataset composition on model performance	Jan 1, 2021	Experimental DesignMachine Translation	—Unverified
(2.5+1)D Spatio-Temporal Scene Graphs for Video Question Answering	Feb 18, 2022	Question AnsweringSpatio-temporal Scene Graphs	—Unverified
MMPKUBase: A Comprehensive and High-quality Chinese Multi-modal Knowledge Graph	Aug 3, 2024	AttributeContrastive Learning	—Unverified
Prediction of the Realisation of an Information Need: An EEG Study	Jun 12, 2024	EEGInformation Retrieval	—Unverified
Explainable High-order Visual Question Reasoning: A New Benchmark and Knowledge-routed Network	Sep 23, 2019	Question AnsweringTriplet	—Unverified
1-800-SHARED-TASKS at RegNLP: Lexical Reranking of Semantic Retrieval (LeSeR) for Regulatory Question Answering	Dec 8, 2024	Answer GenerationDomain Adaptation	—Unverified
Preferred Answer Selection in Stack Overflow: Better Text Representations ... and Metadata, Metadata, Metadata	Nov 1, 2018	Answer SelectionCommunity Question Answering	—Unverified
PREFER: Using a Graph-Based Approach to Generate Paraphrases for Language Learning	Jun 1, 2012	Machine TranslationParaphrase Generation	—Unverified
Joint Learning with Global Inference for Comment Classification in Community Question Answering	Jun 1, 2016	Community Question AnsweringGeneral Classification	—Unverified
Joint learning of object graph and relation graph for visual question answering	May 9, 2022	AttributeGraph Neural Network	—Unverified
DataFrame QA: A Universal LLM Framework on DataFrame Question Answering Without Data Exposure	Jan 27, 2024	Information RetrievalQuestion Answering	—Unverified
PreSTU: Pre-Training for Scene-Text Understanding	Sep 12, 2022	DecoderImage Captioning	—Unverified
Joint Learning of Entity Linking Constraints Using a Markov-Logic Network	Mar 1, 2014	Entity LinkingQuestion Answering	—Unverified
Data-efficient Meta-models for Evaluation of Context-based Questions and Answers in LLMs	May 29, 2025	Dimensionality ReductionHallucination	—Unverified
Joint Learning of a Dual SMT System for Paraphrase Generation	Jul 1, 2012	Machine TranslationParaphrase Generation	—Unverified
Joint Information Extraction and Reasoning: A Scalable Statistical Relational Learning Approach	Jul 1, 2015	Entity Extraction using GANMachine Translation	—Unverified
Data-Efficient French Language Modeling with CamemBERTa	Jun 2, 2023	Dependency ParsingFLUE	—Unverified
Pretraining and Updates of Domain-Specific LLM: A Case Study in the Japanese Business Domain	Apr 12, 2024	Continual PretrainingGeneral Knowledge	—Unverified
Joint Inference for Heterogeneous Dependency Parsing	Aug 1, 2013	Dependency ParsingMachine Translation	—Unverified
Joint Inference for Fine-grained Opinion Extraction	Aug 1, 2013	Fine-Grained Opinion AnalysisQuestion Answering	—Unverified
Pre-training for Information Retrieval: Are Hyperlinks Fully Explored?	Sep 14, 2022	Information RetrievalQuestion Answering	—Unverified
Pre-training image-language transformers for open-vocabulary tasks	Sep 9, 2022	Question AnsweringVisual Entailment	—Unverified
Data-Efficient Autoregressive Document Retrieval for Fact Verification	Nov 17, 2022	ArticlesFact Verification	—Unverified
Pre-training Language Models with Deterministic Factual Knowledge	Oct 20, 2022	Knowledge ProbingQuestion Answering	—Unverified
Automatic Dataset Generation for Knowledge Intensive Question Answering Tasks	May 20, 2025	Dataset GenerationQuestion Answering	—Unverified
Joint Image Captioning and Question Answering	May 22, 2018	Image CaptioningQuestion Answering	—Unverified
Joint Event Trigger Identification and Event Coreference Resolution with Structured Perceptron	Sep 1, 2015	coreference-resolutionCoreference Resolution	—Unverified
Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction	Apr 24, 2025	Conformal PredictionHallucination	—Unverified
Pre-training Universal Language Representation	May 30, 2021	Question AnsweringRepresentation Learning	—Unverified
Joint Event Extraction along Shortest Dependency Paths using Graph Convolutional Networks	Mar 19, 2020	Event ExtractionInformation Retrieval	—Unverified
Pretrain Knowledge-Aware Language Models	Jan 1, 2021	Knowledge ProbingLanguage Modeling	—Unverified
PreWoMe: Exploiting Presuppositions as Working Memory for Long Form Question Answering	Oct 24, 2023	FormLong Form Question Answering	—Unverified
Joint Entity Recognition and Disambiguation	Sep 1, 2015	ChunkingEntity Linking	—Unverified
Automatic Coupling of Answer Extraction and Information Retrieval	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Joint Embeddings of Chinese Words, Characters, and Fine-grained Subcharacter Components	Sep 1, 2017	Named Entity Recognition (NER)Question Answering	—Unverified
JoBimText Visualizer: A Graph-based Approach to Contextualizing Distributional Similarity	Oct 1, 2013	Domain AdaptationGraph Clustering	—Unverified
Data augmentation techniques for the Video Question Answering task	Aug 22, 2020	Data AugmentationQuestion Answering	—Unverified
Automatic Compound Processing: Compound Splitting and Semantic Analysis for Afrikaans and Dutch	Aug 1, 2014	Machine TranslationQuestion Answering	—Unverified
Advances in Natural Language Question Answering: A Review	Apr 10, 2019	Deep LearningQuestion Answering	—Unverified
Data Augmentation for Visual Question Answering	Sep 1, 2017	Data AugmentationGeneral Classification	—Unverified

Show:10 25 50

← PrevPage 151 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified