Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6651–6675 of 10817 papers

Title	Date	Tasks	Status
Models in the Loop: Aiding Crowdworkers with Generative Annotation Assistants	Dec 16, 2021	Extractive Question-AnsweringQuestion Answering	—Unverified
Unsupervised Matching of Data and Text	Dec 16, 2021	Entity ResolutionQuestion Answering	CodeCode Available
Block-Skim: Efficient Question Answering for Transformer	Dec 16, 2021	Extractive Question-AnsweringQuestion Answering	CodeCode Available
Long Context Question Answering via Supervised Contrastive Learning	Dec 16, 2021	Contrastive LearningQuestion Answering	CodeCode Available
CONQRR: Conversational Query Rewriting for Retrieval with Reinforcement Learning	Dec 16, 2021	Conversational Question AnsweringPassage Retrieval	—Unverified
3D Question Answering	Dec 15, 2021	3D geometryQuestion Answering	—Unverified
Learning to Transpile AMR into SPARQL	Dec 15, 2021	Abstract Meaning RepresentationKnowledge Base Question Answering	—Unverified
CoCo-BERT: Improving Video-Language Pre-training with Contrastive Cross-modal Matching and Denoising	Dec 14, 2021	Cross-Modal RetrievalDecoder	—Unverified
You Only Need One Model for Open-domain Question Answering	Dec 14, 2021	Hard AttentionNatural Questions	—Unverified
Few-shot Multi-hop Question Answering over Knowledge Base	Dec 14, 2021	Few-Shot LearningKnowledge Base Question Answering	—Unverified
Multi-Row, Multi-Span Distant Supervision For Table+Text Question	Dec 14, 2021	Question AnsweringReading Comprehension	—Unverified
Tackling Query-Focused Summarization as A Knowledge-Intensive Task: A Pilot Study	Dec 14, 2021	Open-Domain Question AnsweringPassage Retrieval	—Unverified
Explanation Container in Case-Based Biomedical Question-Answering	Dec 13, 2021	Question Answering	—Unverified
Improving and Diagnosing Knowledge-Based Visual Question Answering via Entity Enhanced Knowledge Injection	Dec 13, 2021	Common Sense ReasoningKnowledge Graph Embeddings	—Unverified
GLaM: Efficient Scaling of Language Models with Mixture-of-Experts	Dec 13, 2021	Common Sense ReasoningIn-Context Learning	—Unverified
Injecting Numerical Reasoning Skills into Knowledge Base Question Answering Models	Dec 12, 2021	Data AugmentationKnowledge Base Question Answering	CodeCode Available
Findings on Conversation Disentanglement	Dec 10, 2021	Conversational Question AnsweringConversation Disentanglement	—Unverified
Unified Multimodal Pre-training and Prompt-based Tuning for Vision-Language Understanding and Generation	Dec 10, 2021	Image-text matchingImage-text Retrieval	—Unverified
VUT: Versatile UI Transformer for Multi-Modal Multi-Task User Interface Modeling	Dec 10, 2021	object-detectionObject Detection	—Unverified
Improving the Question Answering Quality using Answer Candidate Filtering based on Natural-Language Features	Dec 10, 2021	Question Answering	—Unverified
Semantic Search as Extractive Paraphrase Span Detection	Dec 9, 2021	Extractive Question-AnsweringQuestion Answering	CodeCode Available
Prompt-based Zero-shot Relation Extraction with Semantic Knowledge Augmentation	Dec 8, 2021	ClassificationQuestion Answering	CodeCode Available
Improving language models by retrieving from trillions of tokens	Dec 8, 2021	Language ModellingQuestion Answering	CodeCode Available
Natural Answer Generation: From Factoid Answer to Full-length Answer using Grammar Correction	Dec 7, 2021	Answer GenerationQuestion Answering	—Unverified
Semantic Answer Type and Relation Prediction Task (SMART 2021)	Dec 7, 2021	Knowledge Base Question AnsweringPrediction	—Unverified

Show:10 25 50

← PrevPage 267 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified