Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5101–5150 of 10817 papers

Title	Date	Tasks	Status	Hype
CAVE: Correcting Attribute Values in E-commerce Profiles	Oct 17, 2022	AttributeAttribute Value Extraction	CodeCode Available	0
PACIFIC: Towards Proactive Conversational Question Answering over Tabular and Textual Data in Finance	Oct 17, 2022	Code GenerationConversational Question Answering	CodeCode Available	1
Plug-and-Play VQA: Zero-shot VQA by Conjoining Large Pretrained Models with Zero Training	Oct 17, 2022	Image CaptioningNetwork Interpretation	CodeCode Available	0
Adversarial and Safely Scaled Question Generation	Oct 17, 2022	MisinformationQuestion Answering	—Unverified	0
Deep Bidirectional Language-Knowledge Graph Pretraining	Oct 17, 2022	Common Sense ReasoningKnowledge Graphs	CodeCode Available	2
ReasonChainQA: Text-based Complex Question Answering with Explainable Evidence Chains	Oct 17, 2022	Answer GenerationDiversity	—Unverified	0
Vision-Language Pre-training: Basics, Recent Advances, and Future Trends	Oct 17, 2022	Few-Shot LearningImage Captioning	CodeCode Available	3
RARR: Researching and Revising What Language Models Say, Using Language Models	Oct 17, 2022	Few-Shot LearningLanguage Modeling	CodeCode Available	1
Answer ranking in Community Question Answering: a deep learning approach	Oct 16, 2022	AttributeCommunity Question Answering	—Unverified	0
Video in 10 Bits: Few-Bit VideoQA for Efficiency and Privacy	Oct 15, 2022	Feature CompressionQuestion Answering	CodeCode Available	2
UniRPG: Unified Discrete Reasoning over Table and Text as Program Generation	Oct 15, 2022	Question AnsweringSemantic Parsing	CodeCode Available	1
Can Language Representation Models Think in Bets?	Oct 14, 2022	Decision MakingNatural Language Understanding	—Unverified	0
MICO: A Multi-alternative Contrastive Learning Framework for Commonsense Knowledge Representation	Oct 14, 2022	Contrastive LearningKnowledge Graph Completion	CodeCode Available	1
SQA3D: Situated Question Answering in 3D Scenes	Oct 14, 2022	Question AnsweringReferring Expression	CodeCode Available	1
"John is 50 years old, can his son be 65?" Evaluating NLP Models' Understanding of Feasibility	Oct 14, 2022	Binary ClassificationQuestion Answering	CodeCode Available	0
TweetNERD -- End to End Entity Linking Benchmark for Tweets	Oct 14, 2022	BenchmarkingEntity Linking	CodeCode Available	0
ConEntail: An Entailment-based Framework for Universal Zero and Few Shot Classification with Supervised Contrastive Pretraining	Oct 14, 2022	ClassificationNatural Language Inference	CodeCode Available	0
SODAPOP: Open-Ended Discovery of Social Biases in Social Commonsense Reasoning Models	Oct 13, 2022	DiagnosticLanguage Modeling	CodeCode Available	0
Towards End-to-End Open Conversational Machine Reading	Oct 13, 2022	Decision MakingQuestion Answering	CodeCode Available	0
Closed-book Question Generation via Contrastive Learning	Oct 13, 2022	Contrastive LearningNatural Questions	CodeCode Available	0
MAPL: Parameter-Efficient Adaptation of Unimodal Pre-Trained Models for Vision-Language Few-Shot Prompting	Oct 13, 2022	Image CaptioningQuestion Answering	CodeCode Available	1
Benchmarking Long-tail Generalization with Likelihood Splits	Oct 13, 2022	BenchmarkingLanguage Modeling	CodeCode Available	0
Overview of BioASQ 2022: The tenth BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering	Oct 13, 2022	Question Answering	—Unverified	0
Shortcomings of Question Answering Based Factuality Frameworks for Error Localization	Oct 13, 2022	Abstractive Text SummarizationQuestion Answering	CodeCode Available	0
Challenges in Explanation Quality Evaluation	Oct 13, 2022	Question Answering	—Unverified	0
Towards a Unified Multi-Dimensional Evaluator for Text Generation	Oct 13, 2022	nlg evaluationQuestion Answering	CodeCode Available	2
OpenCQA: Open-ended Question Answering with Charts	Oct 12, 2022	Arithmetic ReasoningDescriptive	CodeCode Available	1
Improving Question Answering with Generation of NQ-like Questions	Oct 12, 2022	Natural QuestionsQuestion Answering	—Unverified	0
Long-Form Video-Language Pre-Training with Multimodal Temporal Contrastive Learning	Oct 12, 2022	Contrastive LearningForm	CodeCode Available	2
CIKQA: Learning Commonsense Inference with a Unified Knowledge-in-the-loop QA Paradigm	Oct 12, 2022	Question AnsweringTask 2	—Unverified	0
Are Sample-Efficient NLP Models More Robust?	Oct 12, 2022	Extractive Question-Answeringimage-classification	—Unverified	0
SlotFormer: Unsupervised Visual Dynamics Simulation with Object-Centric Models	Oct 12, 2022	ObjectQuestion Answering	CodeCode Available	1
Task Compass: Scaling Multi-task Pre-training with Task Prefix	Oct 12, 2022	Common Sense ReasoningData Augmentation	CodeCode Available	1
Relational Graph Convolutional Neural Networks for Multihop Reasoning: A Comparative Study	Oct 12, 2022	Question Answering	—Unverified	0
ERNIE-Layout: Layout Knowledge Enhanced Pre-training for Visually-rich Document Understanding	Oct 12, 2022	document-image-classificationDocument Image Classification	CodeCode Available	1
Question Answering Over Biological Knowledge Graph via Amazon Alexa	Oct 12, 2022	ArticlesData Integration	—Unverified	0
Discourse Analysis via Questions and Answers: Parsing Dependency Structures of Questions Under Discussion	Oct 12, 2022	Dependency ParsingQuestion Answering	CodeCode Available	1
Probing Commonsense Knowledge in Pre-trained Language Models with Sense-level Precision and Expanded Vocabulary	Oct 12, 2022	Question Answering	CodeCode Available	0
TwiRGCN: Temporally Weighted Graph Convolution for Question Answering over Temporal Knowledge Graphs	Oct 12, 2022	Knowledge GraphsQuestion Answering	—Unverified	0
Context Generation Improves Open Domain Question Answering	Oct 12, 2022	Language ModelingLanguage Modelling	—Unverified	0
Decoupled Context Processing for Context Augmented Language Modeling	Oct 11, 2022	DecoderLanguage Modeling	—Unverified	0
CSS: Combining Self-training and Self-supervised Learning for Few-shot Dialogue State Tracking	Oct 11, 2022	Dialogue State TrackingMachine Reading Comprehension	—Unverified	0
Task-Aware Specialization for Efficient and Robust Dense Retrieval for Open-Domain Question Answering	Oct 11, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Capturing Global Structural Information in Long Document Question Answering with Compressive Graph Selector Network	Oct 11, 2022	Evidence SelectionGraph Attention	CodeCode Available	0
MAP: Multimodal Uncertainty-Aware Vision-Language Pre-training Model	Oct 11, 2022	Contrastive LearningImage-text matching	CodeCode Available	1
Mixed-modality Representation Learning and Pre-training for Joint Table-and-Text Retrieval in OpenQA	Oct 11, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
How Well Do Multi-hop Reading Comprehension Models Understand Date Information?	Oct 11, 2022	Data AugmentationMulti-Hop Reading Comprehension	CodeCode Available	0
Contrastive Video-Language Learning with Fine-grained Frame Sampling	Oct 10, 2022	Question AnsweringRepresentation Learning	—Unverified	0
Semantic Framework based Query Generation for Temporal Question Answering over Knowledge Graphs	Oct 10, 2022	Knowledge GraphsQuestion Answering	—Unverified	0
Language Prior Is Not the Only Shortcut: A Benchmark for Shortcut Learning in VQA	Oct 10, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 103 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified