Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7151–7200 of 10817 papers

Title	Date	Tasks	Status
Looking Beyond Sentence-Level Natural Language Inference for Question Answering and Text Summarization	Jun 1, 2021	Multiple-choiceNatural Language Inference	—Unverified
DoT: An efficient Double Transformer for NLP tasks with tables	Jun 1, 2021	Question Answering	—Unverified
Learning to Select Question-Relevant Relations for Visual Question Answering	Jun 1, 2021	Graph AttentionQuestion Answering	—Unverified
Adversarial VQA: A New Benchmark for Evaluating the Robustness of VQA Models	Jun 1, 2021	Data AugmentationQuestion Answering	—Unverified
Discovering Better Model Architectures for Medical Query Understanding	Jun 1, 2021	modelNatural Language Inference	—Unverified
What BERTs and GPTs know about your brand? Probing contextual language models for affect associations	Jun 1, 2021	AttributeMarketing	—Unverified
AVA: an Automatic eValuation Approach for Question Answering Systems	Jun 1, 2021	Question Answering	—Unverified
An Emotional Comfort Framework for Improving User Satisfaction in E-Commerce Customer Service Chatbots	Jun 1, 2021	Answer SelectionEmotion Classification	—Unverified
A Coarse to Fine Question Answering System based on Reinforcement Learning	Jun 1, 2021	Deep Reinforcement LearningQuestion Answering	—Unverified
Improving Zero-Shot Cross-lingual Transfer for Multilingual Question Answering over Knowledge Graph	Jun 1, 2021	Bilingual Lexicon InductionCross-Lingual Transfer	—Unverified
What Ingredients Make for an Effective Crowdsourcing Protocol for Difficult NLU Data Collection Tasks?	Jun 1, 2021	Multiple-choiceNatural Language Understanding	CodeCode Available
CoRI: Collective Relation Integration with Data Augmentation for Open Information Extraction	Jun 1, 2021	Data AugmentationKnowledge Graphs	—Unverified
If You Want to Go Far Go Together: Unsupervised Joint Candidate Evidence Retrieval for Multi-hop Question Answering	Jun 1, 2021	Answer SelectionMulti-hop Question Answering	—Unverified
RECONSIDER: Improved Re-Ranking using Span-Focused Cross-Attention for Open Domain Question Answering	Jun 1, 2021	Machine Reading ComprehensionNatural Questions	—Unverified
Question-aware Transformer Models for Consumer Health Question Summarization	Jun 1, 2021	Abstractive Text SummarizationDecoder	—Unverified
Goodwill Hunting: Analyzing and Repurposing Off-the-Shelf Named Entity Linking Systems	Jun 1, 2021	Entity LinkingQuestion Answering	—Unverified
Game-theoretic Vocabulary Selection via the Shapley Value and Banzhaf Index	Jun 1, 2021	Document ClassificationNatural Language Inference	—Unverified
Bangla Natural Language Processing: A Comprehensive Analysis of Classical, Machine Learning, and Deep Learning Based Methods	May 31, 2021	ArticlesBIG-bench Machine Learning	—Unverified
Corpus-Based Paraphrase Detection Experiments and Review	May 31, 2021	Authorship AttributionDeep Learning	—Unverified
Pre-training Universal Language Representation	May 30, 2021	Question AnsweringRepresentation Learning	—Unverified
A Compression-Compilation Framework for On-mobile Real-time BERT Applications	May 30, 2021	Question AnsweringText Generation	—Unverified
LPF: A Language-Prior Feedback Objective Function for De-biased Visual Question Answering	May 29, 2021	Question AnsweringVisual Question Answering	CodeCode Available
Is Sluice Resolution really just Question Answering?	May 29, 2021	Question Answering	—Unverified
Feature extraction and evaluation for BioMedical Question Answering	May 28, 2021	Question AnsweringSentence	—Unverified
Towards More Equitable Question Answering Systems: How Much More Data Do You Need?	May 28, 2021	Cross-Lingual TransferData Augmentation	CodeCode Available
Inside ASCENT: Exploring a Deep Commonsense Knowledge Base and its Usage in Question Answering	May 28, 2021	Commonsense Knowledge Base ConstructionQuestion Answering	—Unverified
MixQA: Embedding and Answer Mixing for Question Answering	May 27, 2021	Question Answering	—Unverified
Improve Query Focused Abstractive Summarization by Incorporating Answer Relevance	May 27, 2021	Abstractive Text SummarizationQuery-focused Summarization	CodeCode Available
A Survey on Complex Knowledge Base Question Answering: Methods, Challenges and Solutions	May 25, 2021	Information RetrievalKnowledge Base Question Answering	—Unverified
Guiding the Growth: Difficulty-Controllable Question Generation through Step-by-Step Rewriting	May 25, 2021	Question AnsweringQuestion Generation	—Unverified
Few-Shot Upsampling for Protest Size Detection	May 24, 2021	Language ModellingQuestion Answering	CodeCode Available
StructuralLM: Structural Pre-training for Form Understanding	May 24, 2021	document-image-classificationDocument Image Classification	—Unverified
VANiLLa : Verbalized Answers in Natural Language at Large Scale	May 24, 2021	BIG-bench Machine LearningKnowledge Graphs	CodeCode Available
ReasonBert: Pre-trained to Reason with Distant Supervision	May 23, 2021	Extractive Question-AnsweringQuestion Answering	—Unverified
Probing Inter-modality: Visual Parsing with Self-Attention for Vision-and-Language Pre-training	May 21, 2021	Question AnsweringRelation	—Unverified
Sentence Extraction-Based Machine Reading Comprehension for Vietnamese	May 19, 2021	ArticlesMachine Reading Comprehension	—Unverified
Geographic Question Answering: Challenges, Uniqueness, Classification, and Future Directions	May 19, 2021	ClassificationGeographic Question Answering	—Unverified
Training Heterogeneous Features in Sequence to Sequence Tasks: Latent Enhanced Multi-filter Seq2Seq Model	May 18, 2021	ClusteringDecoder	CodeCode Available
SGD-QA: Fast Schema-Guided Dialogue State Tracking for Unseen Services	May 17, 2021	Dialogue State TrackingGoal-Oriented Dialogue Systems	—Unverified
Survey of Visual-Semantic Embedding Methods for Zero-Shot Image Retrieval	May 16, 2021	Graph GenerationImage Captioning	—Unverified
UniK-QA: Unified Representations of Structured and Unstructured Knowledge for Open-Domain Question Answering	May 16, 2021	Open-Domain Question AnsweringQuestion Answering	—Unverified
QUASER: Question Answering with Scalable Extractive Rationalization	May 16, 2021	Question Answering	—Unverified
Show Why the Answer is Correct! Towards Explainable AI using Compositional Temporal Attention	May 15, 2021	Question AnsweringVisual Question Answering	—Unverified
Relation-aware Hierarchical Attention Framework for Video Question Answering	May 13, 2021	Question AnsweringRelation	CodeCode Available
Building a Question and Answer System for News Domain	May 12, 2021	ArticlesQuestion Answering	—Unverified
Encoding Explanatory Knowledge for Zero-shot Science Question Answering	May 12, 2021	Question AnsweringScience Question Answering	—Unverified
Cross-Modal Generative Augmentation for Visual Question Answering	May 11, 2021	Data AugmentationQuestion Answering	—Unverified
ReadTwice: Reading Very Large Documents with Memories	May 10, 2021	Question Answering	—Unverified
Recent Advances in Deep Learning Based Dialogue Systems: A Systematic Survey	May 10, 2021	Information RetrievalQuestion Answering	—Unverified
Diff-Explainer: Differentiable Convex Optimization for Explainable Multi-hop Inference	May 7, 2021	Multi-hop Question AnsweringNatural Language Inference	—Unverified

Show:10 25 50

← PrevPage 144 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified