Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1851–1875 of 10817 papers

Title	Date	Tasks	Status	Hype
QA-GNN: Reasoning with Language Models and Knowledge Graphs for Question Answering	Apr 13, 2021	Common Sense ReasoningGraph Representation Learning	CodeCode Available	1
SpartQA: : A Textual Question Answering Benchmark for Spatial Reasoning	Apr 12, 2021	Question AnsweringSpatial Reasoning	CodeCode Available	1
Adapting Language Models for Zero-shot Learning by Meta-tuning on Dataset and Prompt Collections	Apr 10, 2021	Language ModellingNatural Language Inference	CodeCode Available	1
Beyond Question-Based Biases: Assessing Multimodal Shortcut Learning in Visual Question Answering	Apr 7, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1
CBench: Towards Better Evaluation of Question Answering Over Knowledge Graphs	Apr 5, 2021	BenchmarkingKnowledge Graphs	CodeCode Available	1
Conversational Question Answering over Knowledge Graphs with Transformer and Graph Attention Networks	Apr 4, 2021	Conversational Question AnsweringGraph Attention	CodeCode Available	1
MMBERT: Multimodal BERT Pretraining for Improved Medical VQA	Apr 3, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
VisQA: X-raying Vision and Language Reasoning in Transformers	Apr 2, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1
NLQuAD: A Non-Factoid Long Question Answering Data Set	Apr 1, 2021	DescriptivePosition	CodeCode Available	1
FeTaQA: Free-form Table Question Answering	Apr 1, 2021	FormQuestion Answering	CodeCode Available	1
Are Bias Mitigation Techniques for Deep Learning Effective?	Apr 1, 2021	Deep LearningQuestion Answering	CodeCode Available	1
MultiReQA: A Cross-Domain Evaluation forRetrieval Question Answering Models	Apr 1, 2021	Information RetrievalQuestion Answering	CodeCode Available	1
Automatically Generating Cause-and-Effect Questions from Passages	Apr 1, 2021	Question AnsweringQuestion Generation	CodeCode Available	1
Towards General Purpose Vision Systems	Apr 1, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1
SUTD-TrafficQA: A Question Answering Benchmark and an Efficient Network for Video Reasoning over Traffic Events	Mar 29, 2021	Autonomous VehiclesBenchmarking	CodeCode Available	1
Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder Transformers	Mar 29, 2021	DecoderImage Segmentation	CodeCode Available	1
A Comprehensive Review of the Video-to-Text Problem	Mar 27, 2021	Question AnsweringRetrieval	CodeCode Available	1
On the hidden treasure of dialog in video question answering	Mar 26, 2021	Question AnsweringVideo Question Answering	CodeCode Available	1
UNICORN on RAINBOW: A Universal Commonsense Reasoning Model on a New Multitask Benchmark	Mar 24, 2021	Common Sense ReasoningHellaSwag	CodeCode Available	1
QuestEval: Summarization Asks for Fact-based Evaluation	Mar 23, 2021	Question Answering	CodeCode Available	1
Multi-Modal Answer Validation for Knowledge-Based VQA	Mar 23, 2021	Question AnsweringRetrieval	CodeCode Available	1
Controllable Generation from Pre-trained Language Models via Inverse Prompting	Mar 19, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
Cooperative Self-training of Machine Reading Comprehension	Mar 12, 2021	Extractive Question-AnsweringMachine Reading Comprehension	CodeCode Available	1
Knowledge Graph Question Answering using Graph-Pattern Isomorphism	Mar 11, 2021	Domain AdaptationGraph Question Answering	CodeCode Available	1
Hurdles to Progress in Long-form Question Answering	Mar 10, 2021	FormLong Form Question Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 75 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified