Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1501–1550 of 10817 papers

Title	Date	Tasks	Status	Hype
MixGen: A New Multi-Modal Data Augmentation	Jun 16, 2022	Data AugmentationImage-text Retrieval	CodeCode Available	1
Zero-Shot Video Question Answering via Frozen Bidirectional Language Models	Jun 16, 2022	Fill MaskLanguage Modeling	CodeCode Available	1
Coarse-to-Fine Vision-Language Pre-training with Fusion in the Backbone	Jun 15, 2022	Described Object DetectionImage Captioning	CodeCode Available	1
LAVENDER: Unifying Video-Language Understanding as Masked Language Modeling	Jun 14, 2022	DecoderLanguage Modeling	CodeCode Available	1
Memory-Based Model Editing at Scale	Jun 13, 2022	counterfactualDialogue Generation	CodeCode Available	1
Ask to Know More: Generating Counterfactual Explanations for Fake Claims	Jun 10, 2022	Articlescounterfactual	CodeCode Available	1
Learning to Ask Like a Physician	Jun 6, 2022	Question AnsweringQuestion Generation	CodeCode Available	1
No Parameter Left Behind: How Distillation and Model Size Affect Zero-Shot Retrieval	Jun 6, 2022	Argument RetrievalBiomedical Information Retrieval	CodeCode Available	1
Invariant Grounding for Video Question Answering	Jun 6, 2022	Question AnsweringVideo Question Answering	CodeCode Available	1
A-OKVQA: A Benchmark for Visual Question Answering using World Knowledge	Jun 3, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
TCE at Qur'an QA 2022: Arabic Language Question Answering Over Holy Qur'an Using a Post-Processed Ensemble of BERT-based Models	Jun 3, 2022	Ensemble LearningNatural Language Understanding	CodeCode Available	1
Revisiting the "Video" in Video-Language Understanding	Jun 3, 2022	BenchmarkingQuestion Answering	CodeCode Available	1
MultiHiertt: Numerical Reasoning over Multi Hierarchical Tabular and Textual Data	Jun 3, 2022	Question Answering	CodeCode Available	1
REVIVE: Regional Visual Representation Matters in Knowledge-Based Visual Question Answering	Jun 2, 2022	Question AnsweringRetrieval	CodeCode Available	1
TCE at Qur’an QA 2022: Arabic Language Question Answering Over Holy Qur’an Using a Post-Processed Ensemble of BERT-based Models	Jun 1, 2022	Ensemble LearningNatural Language Understanding	CodeCode Available	1
Question Answering Classification for Amharic Social Media Community Based Questions	Jun 1, 2022	8kQuestion Answering	CodeCode Available	1
VIMQA: A Vietnamese Dataset for Advanced Reasoning and Explainable Multi-hop Question Answering	Jun 1, 2022	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
Expressive Scene Graph Generation Using Commonsense Knowledge Infusion for Visual Understanding and Reasoning	May 31, 2022	Common Sense ReasoningGraph Generation	CodeCode Available	1
From Representation to Reasoning: Towards both Evidence and Commonsense Reasoning for Video Question-Answering	May 30, 2022	counterfactualDescriptive	CodeCode Available	1
EA^2E: Improving Consistency with Event Awareness for Document-Level Argument Extraction	May 30, 2022	Event Argument ExtractionKnowledge Base Population	CodeCode Available	1
ZusammenQA: Data Augmentation with Specialized Models for Cross-lingual Open-retrieval Question Answering System	May 30, 2022	Answer GenerationData Augmentation	CodeCode Available	1
Temporal knowledge graph question answering via subgraph reasoning	May 30, 2022	Graph Question AnsweringKnowledge Graphs	CodeCode Available	1
kNN-Prompt: Nearest Neighbor Zero-Shot Inference	May 27, 2022	Domain AdaptationLanguage Modelling	CodeCode Available	1
Learning Dialogue Representations from Consecutive Utterances	May 26, 2022	Contrastive LearningConversational Question Answering	CodeCode Available	1
Would You Ask it that Way? Measuring and Improving Question Naturalness for Knowledge Graph Question Answering	May 25, 2022	Graph Question AnsweringNatural Questions	CodeCode Available	1
Optimizing Test-Time Query Representations for Dense Retrieval	May 25, 2022	Contrastive LearningInformation Retrieval	CodeCode Available	1
TaCube: Pre-computing Data Cubes for Answering Numerical-Reasoning Questions over Tabular Data	May 25, 2022	Question Answering	CodeCode Available	1
Teaching Broad Reasoning Skills for Multi-Step QA by Generating Hard Contexts	May 25, 2022	Question Answering	CodeCode Available	1
mPLUG: Effective and Efficient Vision-Language Learning by Cross-modal Skip-connections	May 24, 2022	Computational Efficiencycross-modal alignment	CodeCode Available	1
On Measuring Social Biases in Prompt-Based Multi-Task Learning	May 23, 2022	FormLanguage Modeling	CodeCode Available	1
Prompt Tuning for Discriminative Pre-trained Language Models	May 23, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
StreamingQA: A Benchmark for Adaptation to New Knowledge over Time in Question Answering Models	May 23, 2022	ArticlesQuestion Answering	CodeCode Available	1
Relphormer: Relational Graph Transformer for Knowledge Graph Representations	May 22, 2022	General KnowledgeGraph Mining	CodeCode Available	1
Language Models with Image Descriptors are Strong Few-Shot Video-Language Learners	May 22, 2022	AttributeAutomatic Speech Recognition	CodeCode Available	1
Table Retrieval May Not Necessitate Table-specific Model Design	May 19, 2022	Hard AttentionNatural Questions	CodeCode Available	1
Automated Crossword Solving	May 19, 2022	Question Answering	CodeCode Available	1
Entailment Tree Explanations via Iterative Retrieval-Generation Reasoner	May 18, 2022	DecoderQuestion Answering	CodeCode Available	1
Dialog Inpainting: Turning Documents into Dialogs	May 18, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
Knowledge Graph Question Answering Datasets and Their Generalizability: Are They Enough for Future Research?	May 13, 2022	Graph Question AnsweringKnowledge Graphs	CodeCode Available	1
Learning to Answer Visual Questions from Web Videos	May 10, 2022	Dataset GenerationQuestion Answering	CodeCode Available	1
UL2: Unifying Language Learning Paradigms	May 10, 2022	Arithmetic ReasoningCommon Sense Reasoning	CodeCode Available	1
ProQA: Structural Prompt-based Pre-training for Unified Question Answering	May 9, 2022	Continual LearningFew-Shot Learning	CodeCode Available	1
The Unreliability of Explanations in Few-shot Prompting for Textual Reasoning	May 6, 2022	In-Context LearningLanguage Modelling	CodeCode Available	1
METGEN: A Module-Based Entailment Tree Generation Framework for Answer Explanation	May 5, 2022	Question Answeringvalid	CodeCode Available	1
Declaration-based Prompt Tuning for Visual Question Answering	May 5, 2022	Image-text matchingLanguage Modeling	CodeCode Available	1
DrugEHRQA: A Question Answering Dataset on Structured and Unstructured Electronic Health Records For Medicine Related Queries	May 3, 2022	Question AnsweringText to SQL	CodeCode Available	1
Paragraph-based Transformer Pre-training for Multi-Sentence Inference	May 2, 2022	Answer SelectionFact Verification	CodeCode Available	1
HOSMEL: A Hot-Swappable Modularized Entity Linking Toolkit for Chinese	May 1, 2022	Entity LinkingQuestion Answering	CodeCode Available	1
Engineering flexible machine learning systems by traversing functionally-invariant paths	Apr 30, 2022	Adversarial RobustnessContinual Learning	CodeCode Available	1
Clues Before Answers: Generation-Enhanced Multiple-Choice QA	Apr 30, 2022	DecoderMultiple-choice	CodeCode Available	1

Show:10 25 50

← PrevPage 31 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified