Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7076–7100 of 10817 papers

Title	Date	Tasks	Status	Hype
Distilling Knowledge from Reader to Retriever for Question Answering	Dec 8, 2020	Information RetrievalKnowledge Distillation	CodeCode Available	1
TAP: Text-Aware Pre-training for Text-VQA and Text-Caption	Dec 8, 2020	Caption GenerationLanguage Modeling	CodeCode Available	1
CRAFT: A Benchmark for Causal Reasoning About Forces and inTeractions	Dec 8, 2020	counterfactualDescriptive	CodeCode Available	1
KgPLM: Knowledge-guided Language Model Pre-training via Generative and Discriminative Learning	Dec 7, 2020	Language ModelingLanguage Modelling	—Unverified	0
Conversational Browsing	Dec 7, 2020	Information RetrievalQuestion Answering	CodeCode Available	0
Grammar-aware sentence classification on quantum computers	Dec 7, 2020	Binary ClassificationClassification	—Unverified	0
FloodNet: A High Resolution Aerial Imagery Dataset for Post Flood Scene Understanding	Dec 5, 2020	image-classificationImage Classification	CodeCode Available	1
RPT: Relational Pre-trained Transformer Is Almost All You Need towards Democratizing Data Preparation	Dec 4, 2020	AllDecoder	—Unverified	0
WeaQA: Weak Supervision via Captions for Visual Question Answering	Dec 4, 2020	Question AnsweringVisual Question Answering	—Unverified	0
Leveraging Abstract Meaning Representation for Knowledge Base Question Answering	Dec 3, 2020	Abstract Meaning RepresentationEntity Linking	—Unverified	0
End-to-End QA on COVID-19: Domain Adaptation with Synthetic Training	Dec 2, 2020	Domain AdaptationInformation Retrieval	—Unverified	0
How Can We Know When Language Models Know? On the Calibration of Language Models for Question Answering	Dec 2, 2020	Common Sense ReasoningQuestion Answering	CodeCode Available	1
Using the Poly-encoder for a COVID-19 Question Answering System	Dec 1, 2020	MisinformationQuestion Answering	CodeCode Available	0
Transformer based Natural Language Generation for Question-Answering	Dec 1, 2020	Question AnsweringText Generation	—Unverified	0
Bridging Question Answering and Discourse The case of Multi-Sentence Questions	Dec 1, 2020	Community Question AnsweringQuestion Answering	—Unverified	0
Domino at FinCausal 2020, Task 1 and 2: Causal Extraction System	Dec 1, 2020	Information RetrievalQuestion Answering	CodeCode Available	0
Automatic Evaluation vs. User Preference in Neural Textual QuestionAnswering over COVID-19 Scientific Literature	Dec 1, 2020	Information RetrievalQuestion Answering	—Unverified	0
Transformer Semantic Parsing	Dec 1, 2020	DecoderQuestion Answering	—Unverified	0
Red Dragon AI at TextGraphs 2020 Shared Task : LIT : LSTM-Interleaved Transformer for Multi-Hop Explanation Ranking	Dec 1, 2020	Question AnsweringRe-Ranking	—Unverified	0
A Semi-Supervised BERT Approach for Arabic Named Entity Recognition	Dec 1, 2020	Information RetrievalMachine Translation	—Unverified	0
Multichannel LSTM-CNN for Telugu Text Classification	Dec 1, 2020	ClassificationInformation Retrieval	—Unverified	0
MUCS@TechDOfication using FineTuned Vectors and n-grams	Dec 1, 2020	Machine TranslationQuestion Answering	—Unverified	0
Development of Hybrid Algorithm for Automatic Extraction of Multiword Expressions from Monolingual and Parallel Corpus of English and Punjabi	Dec 1, 2020	Information RetrievalMachine Translation	—Unverified	0
Question and Answer pair generation for Telugu short stories	Dec 1, 2020	Hybrid Machine LearningPOS	—Unverified	0
Creation of Corpus and Analysis in Code-Mixed Kannada-English Social Media Data for POS Tagging	Dec 1, 2020	coreference-resolutionCoreference Resolution	—Unverified	0

Show:10 25 50

← PrevPage 284 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified