Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7551–7575 of 10817 papers

Title	Date	Tasks	Status
Automatic Dataset Generation for Knowledge Intensive Question Answering Tasks	May 20, 2025	Dataset GenerationQuestion Answering	—Unverified
Joint Image Captioning and Question Answering	May 22, 2018	Image CaptioningQuestion Answering	—Unverified
Joint Event Trigger Identification and Event Coreference Resolution with Structured Perceptron	Sep 1, 2015	coreference-resolutionCoreference Resolution	—Unverified
Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction	Apr 24, 2025	Conformal PredictionHallucination	—Unverified
Joint Event Extraction along Shortest Dependency Paths using Graph Convolutional Networks	Mar 19, 2020	Event ExtractionInformation Retrieval	—Unverified
Joint Entity Recognition and Disambiguation	Sep 1, 2015	ChunkingEntity Linking	—Unverified
Automatic Coupling of Answer Extraction and Information Retrieval	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Probabilistic Neural-symbolic Models for Interpretable Visual Question Answering	Feb 21, 2019	counterfactualQuestion Answering	—Unverified
Joint Embeddings of Chinese Words, Characters, and Fine-grained Subcharacter Components	Sep 1, 2017	Named Entity Recognition (NER)Question Answering	—Unverified
JoBimText Visualizer: A Graph-based Approach to Contextualizing Distributional Similarity	Oct 1, 2013	Domain AdaptationGraph Clustering	—Unverified
Data augmentation techniques for the Video Question Answering task	Aug 22, 2020	Data AugmentationQuestion Answering	—Unverified
Automatic Compound Processing: Compound Splitting and Semantic Analysis for Afrikaans and Dutch	Aug 1, 2014	Machine TranslationQuestion Answering	—Unverified
Advances in Natural Language Question Answering: A Review	Apr 10, 2019	Deep LearningQuestion Answering	—Unverified
Data Augmentation for Visual Question Answering	Sep 1, 2017	Data AugmentationGeneral Classification	—Unverified
基於特徵粒度之訓練策略於中文口語問答系統之應用(A Feature-granularity Training Strategy for Chinese Spoken Question Answering)	Oct 1, 2019	Question Answering	—Unverified
Probing Inter-modality: Visual Parsing with Self-Attention for Vision-and-Language Pre-training	May 21, 2021	Question AnsweringRelation	—Unverified
Automatic classification of doctor-patient questions for a virtual patient record query task	Aug 1, 2017	BIG-bench Machine LearningDialogue Management	—Unverified
基於特徵粒度之訓練策略於中文口語問答系統之應用 (A Feature-granularity Training Strategy for Chinese Spoken Question Answering)	Dec 1, 2019	Question Answering	—Unverified
基於深度學習之簡答題問答系統初步探討(A Preliminary Study on Deep Learning-based Short Answer Question Answering System)	Oct 1, 2019	Question Answering	—Unverified
Probing the Role of Positional Information in Vision-Language Models	May 17, 2023	Contrastive LearningImage-text matching	—Unverified
Data Augmentation for Biomedical Factoid Question Answering	Jan 16, 2022	Data AugmentationInformation Retrieval	—Unverified
Problematic Cases in the Annotation of Negation in Spanish	Dec 1, 2016	NegationNegation Detection	—Unverified
基于多头注意力和BiLSTM改进DAM模型的中文问答匹配方法(Chinese question answering method based on multi-head attention and BiLSTM improved DAM model)	Oct 1, 2020	Deep AttentionQuestion Answering	—Unverified
Jiangnan at SemEval-2018 Task 11: Deep Neural Network with Attention Method for Machine Comprehension Task	Jun 1, 2018	Machine Reading ComprehensionNamed Entity Recognition (NER)	—Unverified
Data Augmentation for BERT Fine-Tuning in Open-Domain Question Answering	Apr 14, 2019	Data AugmentationOpen-Domain Question Answering	—Unverified

Show:10 25 50

← PrevPage 303 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified