Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5926–5950 of 10817 papers

Title	Date	Tasks	Status	Hype
Retrieving Visual Facts For Few-Shot Visual Question Answering	Jan 16, 2022	Language ModelingLanguage Modelling	—Unverified	0
QAFactEval: Improved QA-Based Factual Consistency Evaluation for Summarization	Jan 16, 2022	Question AnsweringQuestion Generation	—Unverified	0
UnifiedSKG: Unifying and Multi-Tasking Structured Knowledge Grounding with Text-to-Text Language Models	Jan 16, 2022	Few-Shot LearningQuestion Answering	CodeCode Available	2
Double Retrieval and Ranking for Accurate Question Answering	Jan 16, 2022	Answer SelectionQuestion Answering	—Unverified	0
In Situ Answer Sentence Selection at Web-scale	Jan 16, 2022	Multi-Task LearningOpen-Domain Question Answering	—Unverified	0
Natural Language Deduction through Search over Statement Compositions	Jan 16, 2022	Fact CheckingQuestion Answering	—Unverified	0
Ensemble Transformer for Efficient and Accurate Ranking Tasks: an Application to Question Answering Systems	Jan 15, 2022	DiversityEfficient Neural Network	CodeCode Available	0
Reasoning over Hybrid Chain for Table-and-Text Open Domain QA	Jan 15, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Kformer: Knowledge Injection in Transformer Feed-Forward Layers	Jan 15, 2022	Language ModellingMedical Question Answering	CodeCode Available	1
CLIP-TD: CLIP Targeted Distillation for Vision-Language Tasks	Jan 15, 2022	Question AnsweringVisual Commonsense Reasoning	—Unverified	0
A Benchmark for Generalizable and Interpretable Temporal Question Answering over Knowledge Bases	Jan 15, 2022	Knowledge Base Question AnsweringQuestion Answering	CodeCode Available	0
Sequence-to-Sequence Models for Extracting Information from Registration and Legal Documents	Jan 14, 2022	Open Information ExtractionQuestion Answering	CodeCode Available	1
A Thousand Words Are Worth More Than a Picture: Natural Language-Centric Outside-Knowledge Visual Question Answering	Jan 14, 2022	Generative Question AnsweringImage to text	—Unverified	0
Towards Automated Error Analysis: Learning to Characterize Errors	Jan 13, 2022	Common Sense ReasoningMeta-Learning	—Unverified	0
Grow-and-Clip: Informative-yet-Concise Evidence Distillation for Answer Explanation	Jan 13, 2022	InformativenessQuestion Answering	—Unverified	0
On the Efficacy of Co-Attention Transformer Layers in Visual Question Answering	Jan 11, 2022	POSQuestion Answering	—Unverified	0
Uni-EDEN: Universal Encoder-Decoder Network by Multi-Granular Vision-Language Pre-training	Jan 11, 2022	DecoderImage Captioning	—Unverified	0
SCROLLS: Standardized CompaRison Over Long Language Sequences	Jan 10, 2022	DecoderLong-range modeling	CodeCode Available	1
COIN: Counterfactual Image Generation for VQA Interpretation	Jan 10, 2022	counterfactualImage Generation	—Unverified	0
Extraction of Product Specifications from the Web -- Going Beyond Tables and Lists	Jan 8, 2022	AttributeQuestion Answering	—Unverified	0
Development of an Extractive Clinical Question Answering Dataset with Multi-Answer and Multi-Focus Questions	Jan 7, 2022	Extractive Question-AnsweringQuestion Answering	—Unverified	0
Does Entity Abstraction Help Generative Transformers Reason?	Jan 5, 2022	Conversational Question AnsweringLogical Reasoning	—Unverified	0
Multi Document Reading Comprehension	Jan 5, 2022	Question AnsweringReading Comprehension	—Unverified	0
Interactive Attention AI to translate low light photos to captions for night scene understanding in women safety	Jan 4, 2022	DecoderDeep Learning	—Unverified	0
V-Doc: Visual Questions Answers With Documents	Jan 1, 2022	Question AnsweringQuestion Generation	—Unverified	0

Show:10 25 50

← PrevPage 238 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified