Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6151–6175 of 10817 papers

Title	Date	Tasks	Status
Knowledge Graph Curation: A Practical Framework	Aug 17, 2022	Knowledge GraphsMissing Values	—Unverified
ILLUME: Rationalizing Vision-Language Models through Human Interactions	Aug 17, 2022	Image CaptioningQuestion Answering	CodeCode Available
Steps to Knowledge Graphs Quality Assessment	Aug 16, 2022	Knowledge GraphsQuestion Answering	—Unverified
Continuous Active Learning Using Pretrained Transformers	Aug 15, 2022	Active LearningInformation Retrieval	—Unverified
An Answer Verbalization Dataset for Conversational Question Answerings over Knowledge Graphs	Aug 13, 2022	Answer GenerationConversational Question Answering	—Unverified
ForecastTKGQuestions: A Benchmark for Temporal Question Answering and Forecasting over Temporal Knowledge Graphs	Aug 12, 2022	Knowledge GraphsQuestion Answering	CodeCode Available
Aesthetic Visual Question Answering of Photographs	Aug 10, 2022	Question AnsweringSentiment Analysis	—Unverified
Unsupervised Question Clarity Prediction Through Retrieved Item Coherency	Aug 9, 2022	Conversational Question AnsweringPrediction	—Unverified
Is this Change the Answer to that Problem? Correlating Descriptions of Bug and Code Changes for Evaluating Patch Correctness	Aug 8, 2022	Question Answering	CodeCode Available
Low-Resource Dense Retrieval for Open-Domain Question Answering: A Comprehensive Survey	Aug 5, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified
Simplifying Sparse Expert Recommendation by Revisiting Graph Diffusion	Aug 4, 2022	Community Question AnsweringQuestion Answering	—Unverified
Active entailment encoding for explanation tree construction using parsimonious generation of hard negatives	Aug 2, 2022	Explanation GenerationQuestion Answering	—Unverified
Video Question Answering with Iterative Video-Text Co-Tokenization	Aug 1, 2022	Question AnsweringVideo Question Answering	—Unverified
Neuro-Symbolic Learning: Principles and Applications in Ophthalmology	Jul 31, 2022	Common Sense ReasoningImage Captioning	—Unverified
Neural Knowledge Bank for Pretrained Transformers	Jul 31, 2022	Language ModelingLanguage Modelling	—Unverified
Face-to-Face Contrastive Learning for Social Intelligence Question-Answering	Jul 29, 2022	Contrastive LearningGraph Neural Network	—Unverified
Sequence to sequence pretraining for a less-resourced Slovenian language	Jul 28, 2022	Language ModelingLanguage Modelling	CodeCode Available
Uncertainty-based Visual Question Answering: Estimating Semantic Inconsistency between Image and Knowledge Base	Jul 27, 2022	Question AnsweringSemantic Similarity	—Unverified
Towards Complex Document Understanding By Discrete Reasoning	Jul 25, 2022	document understandingQuestion Answering	—Unverified
WinoGAViL: Gamified Association Benchmark to Challenge Vision-and-Language Models	Jul 25, 2022	Common Sense ReasoningGeneral Knowledge	CodeCode Available
Is GPT-3 all you need for Visual Question Answering in Cultural Heritage?	Jul 25, 2022	AllQuestion Answering	—Unverified
Visual Perturbation-aware Collaborative Learning for Overcoming the Language Prior Problem	Jul 24, 2022	DiagnosticQuestion Answering	—Unverified
Semantic-aware Modular Capsule Routing for Visual Question Answering	Jul 21, 2022	Question AnsweringVisual Question Answering	—Unverified
PiC: A Phrase-in-Context Dataset for Phrase Understanding and Semantic Search	Jul 19, 2022	Information RetrievalNatural Language Understanding	CodeCode Available
Step by step: a hierarchical framework for multi-hop knowledge graph reasoning with reinforcement learning	Jul 19, 2022	Hierarchical Reinforcement LearningKnowledge Graphs	CodeCode Available

Show:10 25 50

← PrevPage 247 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified