Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6851–6875 of 10817 papers

Title	Date	Tasks	Status	Hype
`Just because you are right, doesn't mean I am wrong': Overcoming a bottleneck in development and evaluation of Open-Ended VQA tasks	Apr 1, 2021	Question AnsweringVisual Question Answering	—Unverified	0
Structural Encoding and Pre-training Matter: Adapting BERT for Table-Based Fact Verification	Apr 1, 2021	Fact VerificationGraph Neural Network	—Unverified	0
Complex Question Answering on knowledge graphs using machine translation and multi-task learning	Apr 1, 2021	Entity LinkingKnowledge Graphs	—Unverified	0
FeTaQA: Free-form Table Question Answering	Apr 1, 2021	FormQuestion Answering	CodeCode Available	1
Towards General Purpose Vision Systems	Apr 1, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1
CUPID: Adaptive Curation of Pre-training Data for Video-and-Language Representation Learning	Apr 1, 2021	Question AnsweringRepresentation Learning	—Unverified	0
Integrating Subgraph-aware Relation and DirectionReasoning for Question Answering	Apr 1, 2021	Question AnsweringRelation	—Unverified	0
Are Bias Mitigation Techniques for Deep Learning Effective?	Apr 1, 2021	Deep LearningQuestion Answering	CodeCode Available	1
UC2: Universal Cross-lingual Cross-modal Vision-and-Language Pre-training	Apr 1, 2021	Image-text matchingImage-text Retrieval	—Unverified	0
Analysis on Image Set Visual Question Answering	Mar 31, 2021	Question AnsweringVisual Question Answering	—Unverified	0
AGQA: A Benchmark for Compositional Spatio-Temporal Reasoning	Mar 30, 2021	Question AnsweringVideo Question Answering	—Unverified	0
Domain-robust VQA with diverse datasets and methods but no target labels	Mar 29, 2021	Domain AdaptationObject Recognition	—Unverified	0
SUTD-TrafficQA: A Question Answering Benchmark and an Efficient Network for Video Reasoning over Traffic Events	Mar 29, 2021	Autonomous VehiclesBenchmarking	CodeCode Available	1
Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder Transformers	Mar 29, 2021	DecoderImage Segmentation	CodeCode Available	1
'Just because you are right, doesn't mean I am wrong': Overcoming a Bottleneck in the Development and Evaluation of Open-Ended Visual Question Answering (VQA) Tasks	Mar 28, 2021	Question AnsweringVisual Question Answering	CodeCode Available	0
InsertGNN: Can Graph Neural Networks Outperform Humans in TOEFL Sentence Insertion Problem?	Mar 28, 2021	Graph Neural NetworkQuestion Answering	—Unverified	0
You Can Do Better! If You Elaborate the Reason When Making Prediction	Mar 27, 2021	Multiple-choiceNatural Language Inference	—Unverified	0
A Comprehensive Review of the Video-to-Text Problem	Mar 27, 2021	Question AnsweringRetrieval	CodeCode Available	1
Generating and Evaluating Explanations of Attended and Error-Inducing Input Regions for VQA Models	Mar 26, 2021	Question AnsweringVisual Question Answering	—Unverified	0
On the hidden treasure of dialog in video question answering	Mar 26, 2021	Question AnsweringVideo Question Answering	CodeCode Available	1
Visual Grounding Strategies for Text-Only Natural Language Processing	Mar 25, 2021	Image RetrievalLanguage Modeling	—Unverified	0
UNICORN on RAINBOW: A Universal Commonsense Reasoning Model on a New Multitask Benchmark	Mar 24, 2021	Common Sense ReasoningHellaSwag	CodeCode Available	1
Fabula Entropy Indexing: Objective Measures of Story Coherence	Mar 23, 2021	Question AnsweringStory Generation	—Unverified	0
Multi-Modal Answer Validation for Knowledge-Based VQA	Mar 23, 2021	Question AnsweringRetrieval	CodeCode Available	1
QuestEval: Summarization Asks for Fact-based Evaluation	Mar 23, 2021	Question Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 275 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified