Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1851–1900 of 10817 papers

Title	Date	Tasks	Status	Hype
Multi-Step Reasoning Over Unstructured Text with Beam Dense Retrieval	Apr 13, 2021	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
SpartQA: : A Textual Question Answering Benchmark for Spatial Reasoning	Apr 12, 2021	Question AnsweringSpatial Reasoning	CodeCode Available	1
Adapting Language Models for Zero-shot Learning by Meta-tuning on Dataset and Prompt Collections	Apr 10, 2021	Language ModellingNatural Language Inference	CodeCode Available	1
Beyond Question-Based Biases: Assessing Multimodal Shortcut Learning in Visual Question Answering	Apr 7, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1
CBench: Towards Better Evaluation of Question Answering Over Knowledge Graphs	Apr 5, 2021	BenchmarkingKnowledge Graphs	CodeCode Available	1
Conversational Question Answering over Knowledge Graphs with Transformer and Graph Attention Networks	Apr 4, 2021	Conversational Question AnsweringGraph Attention	CodeCode Available	1
MMBERT: Multimodal BERT Pretraining for Improved Medical VQA	Apr 3, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
VisQA: X-raying Vision and Language Reasoning in Transformers	Apr 2, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1
MultiReQA: A Cross-Domain Evaluation forRetrieval Question Answering Models	Apr 1, 2021	Information RetrievalQuestion Answering	CodeCode Available	1
FeTaQA: Free-form Table Question Answering	Apr 1, 2021	FormQuestion Answering	CodeCode Available	1
NLQuAD: A Non-Factoid Long Question Answering Data Set	Apr 1, 2021	DescriptivePosition	CodeCode Available	1
Are Bias Mitigation Techniques for Deep Learning Effective?	Apr 1, 2021	Deep LearningQuestion Answering	CodeCode Available	1
Towards General Purpose Vision Systems	Apr 1, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1
Automatically Generating Cause-and-Effect Questions from Passages	Apr 1, 2021	Question AnsweringQuestion Generation	CodeCode Available	1
Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder Transformers	Mar 29, 2021	DecoderImage Segmentation	CodeCode Available	1
SUTD-TrafficQA: A Question Answering Benchmark and an Efficient Network for Video Reasoning over Traffic Events	Mar 29, 2021	Autonomous VehiclesBenchmarking	CodeCode Available	1
A Comprehensive Review of the Video-to-Text Problem	Mar 27, 2021	Question AnsweringRetrieval	CodeCode Available	1
On the hidden treasure of dialog in video question answering	Mar 26, 2021	Question AnsweringVideo Question Answering	CodeCode Available	1
UNICORN on RAINBOW: A Universal Commonsense Reasoning Model on a New Multitask Benchmark	Mar 24, 2021	Common Sense ReasoningHellaSwag	CodeCode Available	1
QuestEval: Summarization Asks for Fact-based Evaluation	Mar 23, 2021	Question Answering	CodeCode Available	1
Multi-Modal Answer Validation for Knowledge-Based VQA	Mar 23, 2021	Question AnsweringRetrieval	CodeCode Available	1
Controllable Generation from Pre-trained Language Models via Inverse Prompting	Mar 19, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
Cooperative Self-training of Machine Reading Comprehension	Mar 12, 2021	Extractive Question-AnsweringMachine Reading Comprehension	CodeCode Available	1
Knowledge Graph Question Answering using Graph-Pattern Isomorphism	Mar 11, 2021	Domain AdaptationGraph Question Answering	CodeCode Available	1
Hurdles to Progress in Long-form Question Answering	Mar 10, 2021	FormLong Form Question Answering	CodeCode Available	1
AnswerQuest: A System for Generating Question-Answer Items from Multi-Paragraph Documents	Mar 5, 2021	Question AnsweringQuestion Generation	CodeCode Available	1
Logic Embeddings for Complex Query Answering	Feb 28, 2021	Complex Query AnsweringKnowledge Graphs	CodeCode Available	1
Less is More: Pre-train a Strong Text Encoder for Dense Retrieval Using a Weak Decoder	Feb 18, 2021	DecoderLanguage Modeling	CodeCode Available	1
SLAKE: A Semantically-Labeled Knowledge-Enhanced Dataset for Medical Visual Question Answering	Feb 18, 2021	Medical Visual Question AnsweringQuestion Answering	CodeCode Available	1
Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual Concepts	Feb 17, 2021	Caption GenerationDiversity	CodeCode Available	1
NoiseQA: Challenge Set Evaluation for User-Centric Question Answering	Feb 16, 2021	Question Answering	CodeCode Available	1
PAQ: 65 Million Probably-Asked Questions and What You Can Do With Them	Feb 13, 2021	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Less is More: ClipBERT for Video-and-Language Learning via Sparse Sampling	Feb 11, 2021	Question AnsweringRetrieval	CodeCode Available	1
Nyströmformer: A Nyström-Based Algorithm for Approximating Self-Attention	Feb 7, 2021	Natural Language InferenceQuestion Answering	CodeCode Available	1
Unifying Vision-and-Language Tasks via Text Generation	Feb 4, 2021	Conditional Text GenerationDecoder	CodeCode Available	1
ChainCQG: Flow-Aware Conversational Question Generation	Feb 4, 2021	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
[Re] Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings	Jan 31, 2021	Answer SelectionGraph Embedding	CodeCode Available	1
VisualMRC: Machine Reading Comprehension on Document Images	Jan 27, 2021	Machine Reading ComprehensionNatural Language Understanding	CodeCode Available	1
Mitigating the Position Bias of Transformer Models in Passage Re-Ranking	Jan 18, 2021	Passage Re-RankingPosition	CodeCode Available	1
Match-Ignition: Plugging PageRank into Transformer for Long-form Text Matching	Jan 16, 2021	Community Question AnsweringForm	CodeCode Available	1
ComQA:Compositional Question Answering via Hierarchical Graph Neural Networks	Jan 16, 2021	Answer SelectionMachine Reading Comprehension	CodeCode Available	1
TSQA: Tabular Scenario Based Question Answering	Jan 14, 2021	Machine Reading ComprehensionMultiple-choice	CodeCode Available	1
Improving Multi-hop Knowledge Base Question Answering by Learning Intermediate Supervision Signals	Jan 11, 2021	Knowledge Base Question AnsweringQuestion Answering	CodeCode Available	1
SF-QA: Simple and Fair Evaluation Library for Open-domain Question Answering	Jan 6, 2021	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Did Aristotle Use a Laptop? A Question Answering Benchmark with Implicit Reasoning Strategies	Jan 6, 2021	Question AnsweringStrategyQA	CodeCode Available	1
Personalized Food Recommendation as Constrained Question Answering over a Large-scale Food Knowledge Graph	Jan 5, 2021	Food recommendationNutrition	CodeCode Available	1
End-to-End Training of Neural Retrievers for Open-Domain Question Answering	Jan 2, 2021	Natural QuestionsOpen-Domain Question Answering	CodeCode Available	1
Few-Shot Question Answering by Pretraining Span Selection	Jan 2, 2021	Question Answering	CodeCode Available	1
CDLM: Cross-Document Language Modeling	Jan 2, 2021	Citation RecommendationCoreference Resolution	CodeCode Available	1
Pano-AVQA: Grounded Audio-Visual Question Answering on 360deg Videos	Jan 1, 2021	Audio-visual Question AnsweringQuestion Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 38 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified