Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1526–1550 of 10817 papers

Title	Date	Tasks	Status	Hype
Optimizing Test-Time Query Representations for Dense Retrieval	May 25, 2022	Contrastive LearningInformation Retrieval	CodeCode Available	1
TaCube: Pre-computing Data Cubes for Answering Numerical-Reasoning Questions over Tabular Data	May 25, 2022	Question Answering	CodeCode Available	1
Teaching Broad Reasoning Skills for Multi-Step QA by Generating Hard Contexts	May 25, 2022	Question Answering	CodeCode Available	1
mPLUG: Effective and Efficient Vision-Language Learning by Cross-modal Skip-connections	May 24, 2022	Computational Efficiencycross-modal alignment	CodeCode Available	1
On Measuring Social Biases in Prompt-Based Multi-Task Learning	May 23, 2022	FormLanguage Modeling	CodeCode Available	1
Prompt Tuning for Discriminative Pre-trained Language Models	May 23, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
StreamingQA: A Benchmark for Adaptation to New Knowledge over Time in Question Answering Models	May 23, 2022	ArticlesQuestion Answering	CodeCode Available	1
Relphormer: Relational Graph Transformer for Knowledge Graph Representations	May 22, 2022	General KnowledgeGraph Mining	CodeCode Available	1
Language Models with Image Descriptors are Strong Few-Shot Video-Language Learners	May 22, 2022	AttributeAutomatic Speech Recognition	CodeCode Available	1
Table Retrieval May Not Necessitate Table-specific Model Design	May 19, 2022	Hard AttentionNatural Questions	CodeCode Available	1
Automated Crossword Solving	May 19, 2022	Question Answering	CodeCode Available	1
Entailment Tree Explanations via Iterative Retrieval-Generation Reasoner	May 18, 2022	DecoderQuestion Answering	CodeCode Available	1
Dialog Inpainting: Turning Documents into Dialogs	May 18, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
Knowledge Graph Question Answering Datasets and Their Generalizability: Are They Enough for Future Research?	May 13, 2022	Graph Question AnsweringKnowledge Graphs	CodeCode Available	1
Learning to Answer Visual Questions from Web Videos	May 10, 2022	Dataset GenerationQuestion Answering	CodeCode Available	1
UL2: Unifying Language Learning Paradigms	May 10, 2022	Arithmetic ReasoningCommon Sense Reasoning	CodeCode Available	1
ProQA: Structural Prompt-based Pre-training for Unified Question Answering	May 9, 2022	Continual LearningFew-Shot Learning	CodeCode Available	1
The Unreliability of Explanations in Few-shot Prompting for Textual Reasoning	May 6, 2022	In-Context LearningLanguage Modelling	CodeCode Available	1
METGEN: A Module-Based Entailment Tree Generation Framework for Answer Explanation	May 5, 2022	Question Answeringvalid	CodeCode Available	1
Declaration-based Prompt Tuning for Visual Question Answering	May 5, 2022	Image-text matchingLanguage Modeling	CodeCode Available	1
DrugEHRQA: A Question Answering Dataset on Structured and Unstructured Electronic Health Records For Medicine Related Queries	May 3, 2022	Question AnsweringText to SQL	CodeCode Available	1
Paragraph-based Transformer Pre-training for Multi-Sentence Inference	May 2, 2022	Answer SelectionFact Verification	CodeCode Available	1
HOSMEL: A Hot-Swappable Modularized Entity Linking Toolkit for Chinese	May 1, 2022	Entity LinkingQuestion Answering	CodeCode Available	1
Engineering flexible machine learning systems by traversing functionally-invariant paths	Apr 30, 2022	Adversarial RobustnessContinual Learning	CodeCode Available	1
Clues Before Answers: Generation-Enhanced Multiple-Choice QA	Apr 30, 2022	DecoderMultiple-choice	CodeCode Available	1

Show:10 25 50

← PrevPage 62 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified