Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5401–5450 of 10817 papers

Title	Date	Tasks	Status	Hype
SemEval-2022 Task 9: R2VQ – Competence-based Multimodal Question Answering	Jul 1, 2022	Question Answering	—Unverified	0
MultiSpanQA: A Dataset for Multi-Span Question Answering	Jul 1, 2022	Natural QuestionsQuestion Answering	CodeCode Available	1
Raccoons at SemEval-2022 Task 11: Leveraging Concatenated Word Embeddings for Named Entity Recognition	Jul 1, 2022	Machine Translationnamed-entity-recognition	—Unverified	0
Permutation Invariant Strategy Using Transformer Encoders for Table Understanding	Jul 1, 2022	Column Type AnnotationEntity Linking	—Unverified	0
Ask Me Anything in Your Native Language	Jul 1, 2022	Cross-Lingual Question AnsweringQuestion Answering	—Unverified	0
Zero-shot cross-lingual open domain question answering	Jul 1, 2022	DecoderOpen-Domain Question Answering	—Unverified	0
Conditional Generation with a Question-Answering Blueprint	Jul 1, 2022	Question AnsweringQuestion Generation	—Unverified	0
American == White in Multimodal Language-and-Image AI	Jul 1, 2022	Image CaptioningQuestion Answering	—Unverified	0
Modern Question Answering Datasets and Benchmarks: A Survey	Jun 30, 2022	Deep LearningQuestion Answering	—Unverified	0
A Unified End-to-End Retriever-Reader Framework for Knowledge-based VQA	Jun 30, 2022	Question AnsweringRetrieval	CodeCode Available	1
longhorns at DADC 2022: How many linguists does it take to fool a Question Answering model? A systematic approach to adversarial attacks	Jun 29, 2022	Extractive Question-AnsweringQuestion Answering	—Unverified	0
What Can Secondary Predictions Tell Us? An Exploration on Question-Answering with SQuAD-v2.0	Jun 29, 2022	Question Answering	CodeCode Available	0
EBMs vs. CL: Exploring Self-Supervised Visual Pretraining for Visual Question Answering	Jun 29, 2022	Contrastive LearningOut of Distribution (OOD) Detection	—Unverified	0
On the Robustness of Dialogue History Representation in Conversational Question Answering: A Comprehensive Study and a New Prompt-based Method	Jun 29, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	0
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product Attribute Extraction	Jun 28, 2022	AttributeAttribute Extraction	—Unverified	0
CC-Riddle: A Question Answering Dataset of Chinese Character Riddles	Jun 28, 2022	General KnowledgeLanguage Modelling	CodeCode Available	1
Kwame for Science: An AI Teaching Assistant Based on Sentence-BERT for Science Education in West Africa	Jun 28, 2022	Question AnsweringSentence	—Unverified	0
Consistency-preserving Visual Question Answering in Medical Imaging	Jun 27, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
Contextual embedding and model weighting by fusing domain knowledge on Biomedical Question Answering	Jun 26, 2022	Cloze TestMachine Reading Comprehension	CodeCode Available	0
From Shallow to Deep: Compositional Reasoning over Graphs for Visual Question Answering	Jun 25, 2022	Question AnsweringVisual Question Answering	—Unverified	0
Evaluation of Semantic Answer Similarity Metrics	Jun 25, 2022	Machine TranslationQuestion Answering	CodeCode Available	0
PLATON: Pruning Large Transformer Models with Upper Confidence Bound of Weight Importance	Jun 25, 2022	image-classificationImage Classification	CodeCode Available	1
QAGAN: Adversarial Approach To Learning Domain Invariant Language Features	Jun 24, 2022	Data AugmentationQuestion Answering	CodeCode Available	0
OPERA: Harmonizing Task-Oriented Dialogs and Information Seeking Experience	Jun 24, 2022	Question Answering	CodeCode Available	0
Surgical-VQA: Visual Question Answering in Surgical Scenes using Transformer	Jun 22, 2022	Question AnsweringSentence	CodeCode Available	1
VisFIS: Visual Feature Importance Supervision with Right-for-the-Right-Reason Objectives	Jun 22, 2022	Feature ImportanceQuestion Answering	CodeCode Available	0
Tell Me the Evidence? Dual Visual-Linguistic Interaction for Answer Grounding	Jun 21, 2022	DecoderQuestion Answering	—Unverified	0
Grounding Answers for Visual Questions Asked by Visually Impaired People	Jun 20, 2022	Question AnsweringVisual Question Answering	—Unverified	0
SPBERTQA: A Two-Stage Question Answering System Based on Sentence Transformers for Medical Texts	Jun 20, 2022	Question AnsweringSentence	—Unverified	0
EAGER: Asking and Answering Questions for Automatic Reward Shaping in Language-guided RL	Jun 20, 2022	Question AnsweringQuestion Generation	CodeCode Available	1
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified	0
A Numerical Reasoning Question Answering System with Fine-grained Retriever and the Ensemble of Multiple Generators for FinQA	Jun 17, 2022	Question Answering	—Unverified	0
Unified-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks	Jun 17, 2022	Depth EstimationImage Generation	—Unverified	0
An Open-Domain QA System for e-Governance	Jun 16, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Interpretable AMR-Based Question Decomposition for Multi-hop Question Answering	Jun 16, 2022	Abstract Meaning RepresentationAMR-to-Text Generation	—Unverified	0
Zero-Shot Video Question Answering via Frozen Bidirectional Language Models	Jun 16, 2022	Fill MaskLanguage Modeling	CodeCode Available	1
MixGen: A New Multi-Modal Data Augmentation	Jun 16, 2022	Data AugmentationImage-text Retrieval	CodeCode Available	1
Coarse-to-Fine Vision-Language Pre-training with Fusion in the Backbone	Jun 15, 2022	Described Object DetectionImage Captioning	CodeCode Available	1
Test-Time Adaptation for Visual Document Understanding	Jun 15, 2022	document understandingDomain Adaptation	—Unverified	0
CHQ-Summ: A Dataset for Consumer Healthcare Question Summarization	Jun 14, 2022	Community Question AnsweringDescriptive	CodeCode Available	0
LAVENDER: Unifying Video-Language Understanding as Masked Language Modeling	Jun 14, 2022	DecoderLanguage Modeling	CodeCode Available	1
Task Transfer and Domain Adaptation for Zero-Shot Question Answering	Jun 14, 2022	Domain AdaptationQuestion Answering	CodeCode Available	0
Memory-Based Model Editing at Scale	Jun 13, 2022	counterfactualDialogue Generation	CodeCode Available	1
Improving Pre-trained Language Model Fine-tuning with Noise Stability Regularization	Jun 12, 2022	Domain GeneralizationLanguage Modeling	—Unverified	0
Less Is More: Linear Layers on CLIP Features as Powerful VizWiz Model	Jun 10, 2022	Question AnsweringTask 2	—Unverified	0
Ask to Know More: Generating Counterfactual Explanations for Fake Claims	Jun 10, 2022	Articlescounterfactual	CodeCode Available	1
Few-shot Question Generation for Personalized Feedback in Intelligent Tutoring Systems	Jun 8, 2022	Generative Question AnsweringQuestion Answering	—Unverified	0
Explanation as Question Answering based on a Task Model of the Agent's Design	Jun 8, 2022	AI AgentQuestion Answering	—Unverified	0
Enhancing Dual-Encoders with Question and Answer Cross-Embeddings for Answer Retrieval	Jun 7, 2022	Question AnsweringRepresentation Learning	—Unverified	0
Revealing Single Frame Bias for Video-and-Language Learning	Jun 7, 2022	Action RecognitionFine-grained Action Recognition	CodeCode Available	2

Show:10 25 50

← PrevPage 109 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified