Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4951–4975 of 10817 papers

Title	Date	Tasks	Status	Hype
Analogical Math Word Problems Solving with Enhanced Problem-Solution Association	Dec 1, 2022	MathQuestion Answering	CodeCode Available	0
Iterative Scene Graph Generation with Generative Transformers	Nov 30, 2022	Graph GenerationLink Prediction	—Unverified	0
Weisfeiler and Leman Go Relational	Nov 30, 2022	Knowledge GraphsLogical Reasoning	CodeCode Available	0
AIONER: All-in-one scheme-based biomedical named entity recognition using deep learning	Nov 30, 2022	AllMulti-Task Learning	CodeCode Available	1
A Probabilistic-Logic based Commonsense Representation Framework for Modelling Inferences with Multiple Antecedents and Varying Likelihoods	Nov 30, 2022	Knowledge GraphsQuestion Answering	—Unverified	0
A Pipeline for Generating, Annotating and Employing Synthetic Data for Real World Question Answering	Nov 30, 2022	Question Answering	CodeCode Available	0
Domain Mismatch Doesn't Always Prevent Cross-Lingual Transfer Learning	Nov 30, 2022	Bilingual Lexicon InductionCross-Lingual Transfer	—Unverified	0
Optimizing Explanations by Network Canonization and Hyperparameter Search	Nov 30, 2022	Explainable Artificial Intelligence (XAI)image-classification	—Unverified	0
CREPE: Open-Domain Question Answering with False Presuppositions	Nov 30, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Which Shortcut Solution Do Question Answering Models Prefer to Learn?	Nov 29, 2022	Multiple-choiceQuestion Answering	CodeCode Available	0
Penalizing Confident Predictions on Largely Perturbed Inputs Does Not Improve Out-of-Distribution Generalization in Question Answering	Nov 29, 2022	Out-of-Distribution GeneralizationQuestion Answering	—Unverified	0
Diverse Multi-Answer Retrieval with Determinantal Point Processes	Nov 29, 2022	Open-Domain Question AnsweringPoint Processes	—Unverified	0
Few-shot Query-Focused Summarization with Prefix-Merging	Nov 29, 2022	Few-Shot LearningQuery-focused Summarization	—Unverified	0
PiggyBack: Pretrained Visual Question Answering Environment for Backing up Non-deep Learning Professionals	Nov 29, 2022	Deep LearningQuestion Answering	—Unverified	0
A Survey on Conversational Search and Applications in Biomedicine	Nov 28, 2022	Conversational SearchDialogue Management	—Unverified	0
Frustratingly Easy Label Projection for Cross-lingual Transfer	Nov 28, 2022	Cross-Lingual NERCross-Lingual Transfer	CodeCode Available	1
Neuro-Symbolic Spatio-Temporal Reasoning	Nov 28, 2022	AI AgentImage Segmentation	—Unverified	0
Understanding BLOOM: An empirical study on diverse NLP tasks	Nov 27, 2022	DecoderFew-Shot Text Classification	—Unverified	0
Combining Data Generation and Active Learning for Low-Resource Question Answering	Nov 27, 2022	Active LearningAnswer Generation	CodeCode Available	0
Question Answering and Question Generation for Finnish	Nov 24, 2022	Language ModelingLanguage Modelling	—Unverified	0
Seeing What You Miss: Vision-Language Pre-training with Semantic Completion Learning	Nov 24, 2022	cross-modal alignmentImage-text Retrieval	CodeCode Available	1
TSGP: Two-Stage Generative Prompting for Unsupervised Commonsense Question Answering	Nov 24, 2022	Answer GenerationQuestion Answering	CodeCode Available	0
Self-supervised vision-language pretraining for Medical visual question answering	Nov 24, 2022	Contrastive LearningImage-text matching	CodeCode Available	1
Look, Read and Ask: Learning to Ask Questions by Reading Text in Images	Nov 23, 2022	Optical Character Recognition (OCR)Question Answering	—Unverified	0
Enhancing Self-Consistency and Performance of Pre-Trained Language Models through Natural Language Inference	Nov 21, 2022	Natural Language InferenceQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 199 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified