Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5426–5450 of 10817 papers

Title	Date	Tasks	Status	Hype
VisFIS: Visual Feature Importance Supervision with Right-for-the-Right-Reason Objectives	Jun 22, 2022	Feature ImportanceQuestion Answering	CodeCode Available	0
Tell Me the Evidence? Dual Visual-Linguistic Interaction for Answer Grounding	Jun 21, 2022	DecoderQuestion Answering	—Unverified	0
Grounding Answers for Visual Questions Asked by Visually Impaired People	Jun 20, 2022	Question AnsweringVisual Question Answering	—Unverified	0
SPBERTQA: A Two-Stage Question Answering System Based on Sentence Transformers for Medical Texts	Jun 20, 2022	Question AnsweringSentence	—Unverified	0
EAGER: Asking and Answering Questions for Automatic Reward Shaping in Language-guided RL	Jun 20, 2022	Question AnsweringQuestion Generation	CodeCode Available	1
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified	0
A Numerical Reasoning Question Answering System with Fine-grained Retriever and the Ensemble of Multiple Generators for FinQA	Jun 17, 2022	Question Answering	—Unverified	0
Unified-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks	Jun 17, 2022	Depth EstimationImage Generation	—Unverified	0
An Open-Domain QA System for e-Governance	Jun 16, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Interpretable AMR-Based Question Decomposition for Multi-hop Question Answering	Jun 16, 2022	Abstract Meaning RepresentationAMR-to-Text Generation	—Unverified	0
Zero-Shot Video Question Answering via Frozen Bidirectional Language Models	Jun 16, 2022	Fill MaskLanguage Modeling	CodeCode Available	1
MixGen: A New Multi-Modal Data Augmentation	Jun 16, 2022	Data AugmentationImage-text Retrieval	CodeCode Available	1
Coarse-to-Fine Vision-Language Pre-training with Fusion in the Backbone	Jun 15, 2022	Described Object DetectionImage Captioning	CodeCode Available	1
Test-Time Adaptation for Visual Document Understanding	Jun 15, 2022	document understandingDomain Adaptation	—Unverified	0
CHQ-Summ: A Dataset for Consumer Healthcare Question Summarization	Jun 14, 2022	Community Question AnsweringDescriptive	CodeCode Available	0
LAVENDER: Unifying Video-Language Understanding as Masked Language Modeling	Jun 14, 2022	DecoderLanguage Modeling	CodeCode Available	1
Task Transfer and Domain Adaptation for Zero-Shot Question Answering	Jun 14, 2022	Domain AdaptationQuestion Answering	CodeCode Available	0
Memory-Based Model Editing at Scale	Jun 13, 2022	counterfactualDialogue Generation	CodeCode Available	1
Improving Pre-trained Language Model Fine-tuning with Noise Stability Regularization	Jun 12, 2022	Domain GeneralizationLanguage Modeling	—Unverified	0
Less Is More: Linear Layers on CLIP Features as Powerful VizWiz Model	Jun 10, 2022	Question AnsweringTask 2	—Unverified	0
Ask to Know More: Generating Counterfactual Explanations for Fake Claims	Jun 10, 2022	Articlescounterfactual	CodeCode Available	1
Few-shot Question Generation for Personalized Feedback in Intelligent Tutoring Systems	Jun 8, 2022	Generative Question AnsweringQuestion Answering	—Unverified	0
Explanation as Question Answering based on a Task Model of the Agent's Design	Jun 8, 2022	AI AgentQuestion Answering	—Unverified	0
Enhancing Dual-Encoders with Question and Answer Cross-Embeddings for Answer Retrieval	Jun 7, 2022	Question AnsweringRepresentation Learning	—Unverified	0
Revealing Single Frame Bias for Video-and-Language Learning	Jun 7, 2022	Action RecognitionFine-grained Action Recognition	CodeCode Available	2

Show:10 25 50

← PrevPage 218 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified