Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7401–7425 of 10817 papers

Title	Date	Tasks	Status	Hype
ISCAS at SemEval-2020 Task 5: Pre-trained Transformers for Counterfactual Statement Modeling	Sep 17, 2020	counterfactualQuestion Answering	CodeCode Available	0
A Multimodal Memes Classification: A Survey and Open Research Issues	Sep 17, 2020	ClassificationGeneral Classification	—Unverified	0
Compositional and Lexical Semantics in RoBERTa, BERT and DistilBERT: A Case Study on CoQA	Sep 17, 2020	Conversational Question AnsweringNegation	—Unverified	0
Generation-Augmented Retrieval for Open-domain Question Answering	Sep 17, 2020	Natural QuestionsOpen-Domain Question Answering	CodeCode Available	1
Answering Any-hop Open-domain Questions with Iterative Document Reranking	Sep 16, 2020	Multi-hop Question AnsweringNatural Questions	—Unverified	0
Question Directed Graph Attention Network for Numerical Reasoning over Text	Sep 16, 2020	Graph AttentionMachine Reading Comprehension	CodeCode Available	0
Leveraging Semantic Parsing for Relation Linking over Knowledge Bases	Sep 16, 2020	Abstract Meaning RepresentationQuestion Answering	CodeCode Available	1
Knowledge Graphs for Multilingual Language Translation and Generation	Sep 16, 2020	Knowledge GraphsMachine Translation	—Unverified	0
Cluster-Former: Clustering-based Sparse Transformer for Long-Range Dependency Encoding	Sep 13, 2020	ClusteringLanguage Modelling	—Unverified	0
Receptivity of an AI Cognitive Assistant by the Radiology Community: A Report on Data Collected at RSNA	Sep 13, 2020	Multiple-choiceQuestion Answering	—Unverified	0
Towards an Atlas of Cultural Commonsense for Machine Reasoning	Sep 11, 2020	Question Answering	—Unverified	0
FILTER: An Enhanced Fusion Method for Cross-lingual Language Understanding	Sep 10, 2020	Cross-Lingual TransferNER	CodeCode Available	1
Sanitizing Synthetic Training Data Generation for Question Answering over Knowledge Graphs	Sep 10, 2020	Knowledge GraphsQuestion Answering	—Unverified	0
Accelerating Real-Time Question Answering via Question Generation	Sep 10, 2020	Data AugmentationMulti-Task Learning	—Unverified	0
Pay Attention when Required	Sep 9, 2020	Language ModellingParaphrase Identification	CodeCode Available	0
Aspect Classification for Legal Depositions	Sep 9, 2020	ClassificationGeneral Classification	—Unverified	0
QED: A Framework and Dataset for Explanations in Question Answering	Sep 8, 2020	Explanation GenerationNatural Questions	CodeCode Available	1
E-BERT: A Phrase and Product Knowledge Enhanced Language Model for E-commerce	Sep 7, 2020	Aspect ExtractionDenoising	—Unverified	0
KILT: a Benchmark for Knowledge Intensive Language Tasks	Sep 4, 2020	Entity LinkingFact Checking	CodeCode Available	1
A Comparison of Pre-trained Vision-and-Language Models for Multimodal Representation Learning across Medical Images and Reports	Sep 3, 2020	Image-text RetrievalMedical Visual Question Answering	CodeCode Available	1
SRQA: Synthetic Reader for Factoid Question Answering	Sep 2, 2020	Question Answering	CodeCode Available	0
Revisiting the Open-Domain Question Answering Pipeline	Sep 2, 2020	Information RetrievalMachine Reading Comprehension	—Unverified	0
Text Modular Networks: Learning to Decompose Tasks in the Language of Existing Models	Sep 1, 2020	Question Answering	CodeCode Available	1
Cross-modal Knowledge Reasoning for Knowledge-based Visual Question Answering	Aug 31, 2020	Knowledge GraphsQuestion Answering	—Unverified	0
PNEL: Pointer Network based End-To-End Entity Linking over Knowledge Graphs	Aug 31, 2020	Entity DisambiguationEntity Linking	CodeCode Available	0

Show:10 25 50

← PrevPage 297 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified