Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5301–5325 of 10817 papers

Title	Date	Tasks	Status	Hype
VLMAE: Vision-Language Masked Autoencoder	Aug 19, 2022	Image-text RetrievalLanguage Modeling	—Unverified	0
UnCommonSense: Informative Negative Knowledge about Everyday Concepts	Aug 19, 2022	InformativenessQuestion Answering	—Unverified	0
UKP-SQuARE v2: Explainability and Adversarial Attacks for Trustworthy QA	Aug 19, 2022	Adversarial AttackExplainable Models	CodeCode Available	1
Quantifying the Knowledge in a DNN to Explain Knowledge Distillation for Classification	Aug 18, 2022	3D Point Cloud ClassificationClassification	—Unverified	0
Understanding Attention for Vision-and-Language Tasks	Aug 17, 2022	Image GenerationImage Retrieval	CodeCode Available	0
NECE: Narrative Event Chain Extraction Toolkit	Aug 17, 2022	Question Answering	—Unverified	0
Knowledge Graph Curation: A Practical Framework	Aug 17, 2022	Knowledge GraphsMissing Values	—Unverified	0
ILLUME: Rationalizing Vision-Language Models through Human Interactions	Aug 17, 2022	Image CaptioningQuestion Answering	CodeCode Available	0
Steps to Knowledge Graphs Quality Assessment	Aug 16, 2022	Knowledge GraphsQuestion Answering	—Unverified	0
Continuous Active Learning Using Pretrained Transformers	Aug 15, 2022	Active LearningInformation Retrieval	—Unverified	0
An Answer Verbalization Dataset for Conversational Question Answerings over Knowledge Graphs	Aug 13, 2022	Answer GenerationConversational Question Answering	—Unverified	0
ForecastTKGQuestions: A Benchmark for Temporal Question Answering and Forecasting over Temporal Knowledge Graphs	Aug 12, 2022	Knowledge GraphsQuestion Answering	CodeCode Available	0
Pre-training Tasks for User Intent Detection and Embedding Retrieval in E-commerce Search	Aug 12, 2022	CPUIntent Detection	CodeCode Available	1
Aesthetic Visual Question Answering of Photographs	Aug 10, 2022	Question AnsweringSentiment Analysis	—Unverified	0
CLEVR-Math: A Dataset for Compositional Language, Visual and Mathematical Reasoning	Aug 10, 2022	MathMathematical Reasoning	CodeCode Available	1
Unsupervised Question Clarity Prediction Through Retrieved Item Coherency	Aug 9, 2022	Conversational Question AnsweringPrediction	—Unverified	0
Is this Change the Answer to that Problem? Correlating Descriptions of Bug and Code Changes for Evaluating Patch Correctness	Aug 8, 2022	Question Answering	CodeCode Available	0
Atlas: Few-shot Learning with Retrieval Augmented Language Models	Aug 5, 2022	Fact CheckingFew-Shot Learning	CodeCode Available	2
ChiQA: A Large Scale Image-based Real-World Question Answering Dataset for Multi-Modal Understanding	Aug 5, 2022	Image RetrievalQuestion Answering	CodeCode Available	1
Low-Resource Dense Retrieval for Open-Domain Question Answering: A Comprehensive Survey	Aug 5, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Simplifying Sparse Expert Recommendation by Revisiting Graph Diffusion	Aug 4, 2022	Community Question AnsweringQuestion Answering	—Unverified	0
AlexaTM 20B: Few-Shot Learning Using a Large-Scale Multilingual Seq2Seq Model	Aug 2, 2022	Causal Language ModelingCommon Sense Reasoning	CodeCode Available	2
Active entailment encoding for explanation tree construction using parsimonious generation of hard negatives	Aug 2, 2022	Explanation GenerationQuestion Answering	—Unverified	0
Video Question Answering with Iterative Video-Text Co-Tokenization	Aug 1, 2022	Question AnsweringVideo Question Answering	—Unverified	0
Generative Bias for Robust Visual Question Answering	Aug 1, 2022	Knowledge DistillationQuestion Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 213 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified