Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4976–5000 of 10817 papers

Title	Date	Tasks	Status	Hype
Cross-Modal Contrastive Learning for Robust Reasoning in VQA	Nov 21, 2022	Contrastive LearningQuestion Answering	CodeCode Available	0
SMAUG: Sparse Masked Autoencoder for Efficient Video-Language Pre-training	Nov 21, 2022	cross-modal alignmentGPU	—Unverified	0
Hengam: An Adversarially Trained Transformer for Persian Temporal Tagging	Nov 20, 2022	Information RetrievalNamed Entity Recognition (NER)	CodeCode Available	1
CL-CrossVQA: A Continual Learning Benchmark for Cross-Domain Visual Question Answering	Nov 19, 2022	Continual LearningQuestion Answering	—Unverified	0
Knowledge Graph Contrastive Learning Based on Relation-Symmetrical Structure	Nov 19, 2022	Contrastive LearningGraph Embedding	—Unverified	0
Visual Programming: Compositional visual reasoning without training	Nov 18, 2022	In-Context LearningQuestion Answering	CodeCode Available	2
FiE: Building a Global Probability Space by Leveraging Early Fusion in Encoder for Open-Domain Question Answering	Nov 18, 2022	Data AugmentationDecoder	—Unverified	0
Text-Aware Dual Routing Network for Visual Question Answering	Nov 17, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Summarizing Community-based Question-Answer Pairs	Nov 17, 2022	Abstractive Text SummarizationQuestion Answering	—Unverified	0
Open-Domain Conversational Question Answering with Historical Answers	Nov 17, 2022	Conversational Question AnsweringPassage Retrieval	CodeCode Available	0
Data-Efficient Autoregressive Document Retrieval for Fact Verification	Nov 17, 2022	ArticlesFact Verification	—Unverified	0
I Can't Believe There's No Images! Learning Visual Tasks Using only Language Supervision	Nov 17, 2022	Image CaptioningQuestion Answering	CodeCode Available	1
Visual Commonsense-aware Representation Network for Video Captioning	Nov 17, 2022	Caption GenerationQuestion Answering	CodeCode Available	1
AlignVE: Visual Entailment Recognition Based on Alignment Relations	Nov 16, 2022	Question AnsweringRelation	—Unverified	0
Unified Question Answering in Slovene	Nov 16, 2022	Cross-Lingual TransferDecoder	CodeCode Available	0
RetroMAE v2: Duplex Masked Auto-Encoder For Pre-Training Retrieval-Oriented Language Models	Nov 16, 2022	Dimensionality ReductionInformation Retrieval	CodeCode Available	2
Holistic Evaluation of Language Models	Nov 16, 2022	FairnessQuestion Answering	CodeCode Available	4
Galactica: A Large Language Model for Science	Nov 16, 2022	AnachronismsBias Detection	CodeCode Available	4
Cheater's Bowl: Human vs. Computer Search Strategies for Open-Domain Question Answering	Nov 15, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
PromptCap: Prompt-Guided Task-Aware Image Captioning	Nov 15, 2022	Image CaptioningLanguage Modelling	CodeCode Available	1
A Survey for Efficient Open Domain Question Answering	Nov 15, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
MapQA: A Dataset for Question Answering on Choropleth Maps	Nov 15, 2022	ArticlesQuestion Answering	CodeCode Available	1
Empowering Language Models with Knowledge Graph Reasoning for Question Answering	Nov 15, 2022	Knowledge GraphsLanguage Modeling	—Unverified	0
A Comparative Study of Question Answering over Knowledge Bases	Nov 15, 2022	DiversityQuestion Answering	CodeCode Available	0
Introducing Semantics into Speech Encoders	Nov 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 200 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified