Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7401–7425 of 10817 papers

Title	Date	Tasks	Status
Video Question Answering Using Language-Guided Deep Compressed-Domain Video Feature	Jan 1, 2021	Question AnsweringVideo Compression	—Unverified
Hierarchical Graph Attention Network for Few-Shot Visual-Semantic Learning	Jan 1, 2021	Graph AttentionImage Captioning	—Unverified
HAIR: Hierarchical Visual-Semantic Relational Reasoning for Video Question Answering	Jan 1, 2021	Question AnsweringRelational Reasoning	—Unverified
CLEAR: Contrastive Learning for Sentence Representation	Dec 31, 2020	Contrastive LearningLinguistic Acceptability	—Unverified
FiD-Ex: Improving Sequence-to-Sequence Models for Extractive Rationale Generation	Dec 31, 2020	DecoderFact Verification	—Unverified
Studying Strategically: Learning to Mask for Closed-book QA	Dec 31, 2020	Language ModelingLanguage Modelling	—Unverified
ERNIE-Doc: A Retrospective Long-Document Modeling Transformer	Dec 31, 2020	Language ModelingLanguage Modelling	CodeCode Available
Using Natural Language Relations between Answer Choices for Machine Comprehension	Dec 31, 2020	Natural Language InferenceQuestion Answering	CodeCode Available
Seeing is Knowing! Fact-based Visual Question Answering using Knowledge Graph Embeddings	Dec 31, 2020	Common Sense ReasoningKnowledge Graph Embeddings	—Unverified
Coreference Reasoning in Machine Reading Comprehension	Dec 31, 2020	coreference-resolutionCoreference Resolution	CodeCode Available
HopRetriever: Retrieve Hops over Wikipedia to Answer Complex Questions	Dec 31, 2020	Document EmbeddingOpen-Domain Question Answering	—Unverified
Presenting a Dataset for Collaborator Recommending Systems in Academic Social Network: a Case Study on ReseachGate	Dec 29, 2020	Question Answering	—Unverified
Pivot Through English: Reliably Answering Multilingual Questions without Document Retrieval	Dec 28, 2020	Answer GenerationQuestion Answering	—Unverified
BURT: BERT-inspired Universal Representation from Learning Meaningful Segment	Dec 28, 2020	Information RetrievalQuestion Answering	—Unverified
Red Dragon AI at TextGraphs 2020 Shared Task: LIT : LSTM-Interleaved Transformer for Multi-Hop Explanation Ranking	Dec 28, 2020	Question AnsweringRe-Ranking	—Unverified
Commonsense Visual Sensemaking for Autonomous Driving: On Generalised Neurosymbolic Online Abduction Integrating Vision and Semantics	Dec 28, 2020	Autonomous DrivingQuestion Answering	—Unverified
QUACKIE: A NLP Classification Task With Ground Truth Explanations	Dec 24, 2020	ClassificationGeneral Classification	—Unverified
REM-Net: Recursive Erasure Memory Network for Commonsense Evidence Refinement	Dec 24, 2020	Question AnsweringWorld Knowledge	—Unverified
Negation in Cognitive Reasoning	Dec 23, 2020	Formal LogicNegation	CodeCode Available
Object-Centric Diagnosis of Visual Reasoning	Dec 21, 2020	DiagnosticObject	—Unverified
Exploring and Analyzing Machine Commonsense Benchmarks	Dec 21, 2020	Common Sense ReasoningQuestion Answering	—Unverified
Learning content and context with language bias for Visual Question Answering	Dec 21, 2020	Question AnsweringVisual Question Answering	CodeCode Available
Exploring Fluent Query Reformulations with Text-to-Text Transformers and Reinforcement Learning	Dec 18, 2020	intent-classificationIntent Classification	—Unverified
On Modality Bias in the TVQA Dataset	Dec 18, 2020	Question AnsweringVideo Question Answering	CodeCode Available
Trying Bilinear Pooling in Video-QA	Dec 18, 2020	Question AnsweringVideo Question Answering	—Unverified

Show:10 25 50

← PrevPage 297 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified