Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4951–5000 of 10817 papers

Title	Date	Tasks	Status	Hype
Analogical Math Word Problems Solving with Enhanced Problem-Solution Association	Dec 1, 2022	MathQuestion Answering	CodeCode Available	0
Optimizing Explanations by Network Canonization and Hyperparameter Search	Nov 30, 2022	Explainable Artificial Intelligence (XAI)image-classification	—Unverified	0
AIONER: All-in-one scheme-based biomedical named entity recognition using deep learning	Nov 30, 2022	AllMulti-Task Learning	CodeCode Available	1
A Probabilistic-Logic based Commonsense Representation Framework for Modelling Inferences with Multiple Antecedents and Varying Likelihoods	Nov 30, 2022	Knowledge GraphsQuestion Answering	—Unverified	0
A Pipeline for Generating, Annotating and Employing Synthetic Data for Real World Question Answering	Nov 30, 2022	Question Answering	CodeCode Available	0
Weisfeiler and Leman Go Relational	Nov 30, 2022	Knowledge GraphsLogical Reasoning	CodeCode Available	0
Iterative Scene Graph Generation with Generative Transformers	Nov 30, 2022	Graph GenerationLink Prediction	—Unverified	0
Domain Mismatch Doesn't Always Prevent Cross-Lingual Transfer Learning	Nov 30, 2022	Bilingual Lexicon InductionCross-Lingual Transfer	—Unverified	0
CREPE: Open-Domain Question Answering with False Presuppositions	Nov 30, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Penalizing Confident Predictions on Largely Perturbed Inputs Does Not Improve Out-of-Distribution Generalization in Question Answering	Nov 29, 2022	Out-of-Distribution GeneralizationQuestion Answering	—Unverified	0
Diverse Multi-Answer Retrieval with Determinantal Point Processes	Nov 29, 2022	Open-Domain Question AnsweringPoint Processes	—Unverified	0
Which Shortcut Solution Do Question Answering Models Prefer to Learn?	Nov 29, 2022	Multiple-choiceQuestion Answering	CodeCode Available	0
Few-shot Query-Focused Summarization with Prefix-Merging	Nov 29, 2022	Few-Shot LearningQuery-focused Summarization	—Unverified	0
PiggyBack: Pretrained Visual Question Answering Environment for Backing up Non-deep Learning Professionals	Nov 29, 2022	Deep LearningQuestion Answering	—Unverified	0
A Survey on Conversational Search and Applications in Biomedicine	Nov 28, 2022	Conversational SearchDialogue Management	—Unverified	0
Frustratingly Easy Label Projection for Cross-lingual Transfer	Nov 28, 2022	Cross-Lingual NERCross-Lingual Transfer	CodeCode Available	1
Neuro-Symbolic Spatio-Temporal Reasoning	Nov 28, 2022	AI AgentImage Segmentation	—Unverified	0
Understanding BLOOM: An empirical study on diverse NLP tasks	Nov 27, 2022	DecoderFew-Shot Text Classification	—Unverified	0
Combining Data Generation and Active Learning for Low-Resource Question Answering	Nov 27, 2022	Active LearningAnswer Generation	CodeCode Available	0
Seeing What You Miss: Vision-Language Pre-training with Semantic Completion Learning	Nov 24, 2022	cross-modal alignmentImage-text Retrieval	CodeCode Available	1
Question Answering and Question Generation for Finnish	Nov 24, 2022	Language ModelingLanguage Modelling	—Unverified	0
TSGP: Two-Stage Generative Prompting for Unsupervised Commonsense Question Answering	Nov 24, 2022	Answer GenerationQuestion Answering	CodeCode Available	0
Self-supervised vision-language pretraining for Medical visual question answering	Nov 24, 2022	Contrastive LearningImage-text matching	CodeCode Available	1
Look, Read and Ask: Learning to Ask Questions by Reading Text in Images	Nov 23, 2022	Optical Character Recognition (OCR)Question Answering	—Unverified	0
Enhancing Self-Consistency and Performance of Pre-Trained Language Models through Natural Language Inference	Nov 21, 2022	Natural Language InferenceQuestion Answering	—Unverified	0
Cross-Modal Contrastive Learning for Robust Reasoning in VQA	Nov 21, 2022	Contrastive LearningQuestion Answering	CodeCode Available	0
SMAUG: Sparse Masked Autoencoder for Efficient Video-Language Pre-training	Nov 21, 2022	cross-modal alignmentGPU	—Unverified	0
Hengam: An Adversarially Trained Transformer for Persian Temporal Tagging	Nov 20, 2022	Information RetrievalNamed Entity Recognition (NER)	CodeCode Available	1
CL-CrossVQA: A Continual Learning Benchmark for Cross-Domain Visual Question Answering	Nov 19, 2022	Continual LearningQuestion Answering	—Unverified	0
Knowledge Graph Contrastive Learning Based on Relation-Symmetrical Structure	Nov 19, 2022	Contrastive LearningGraph Embedding	—Unverified	0
Visual Programming: Compositional visual reasoning without training	Nov 18, 2022	In-Context LearningQuestion Answering	CodeCode Available	2
FiE: Building a Global Probability Space by Leveraging Early Fusion in Encoder for Open-Domain Question Answering	Nov 18, 2022	Data AugmentationDecoder	—Unverified	0
Text-Aware Dual Routing Network for Visual Question Answering	Nov 17, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
Summarizing Community-based Question-Answer Pairs	Nov 17, 2022	Abstractive Text SummarizationQuestion Answering	—Unverified	0
Open-Domain Conversational Question Answering with Historical Answers	Nov 17, 2022	Conversational Question AnsweringPassage Retrieval	CodeCode Available	0
Data-Efficient Autoregressive Document Retrieval for Fact Verification	Nov 17, 2022	ArticlesFact Verification	—Unverified	0
I Can't Believe There's No Images! Learning Visual Tasks Using only Language Supervision	Nov 17, 2022	Image CaptioningQuestion Answering	CodeCode Available	1
Visual Commonsense-aware Representation Network for Video Captioning	Nov 17, 2022	Caption GenerationQuestion Answering	CodeCode Available	1
AlignVE: Visual Entailment Recognition Based on Alignment Relations	Nov 16, 2022	Question AnsweringRelation	—Unverified	0
Unified Question Answering in Slovene	Nov 16, 2022	Cross-Lingual TransferDecoder	CodeCode Available	0
RetroMAE v2: Duplex Masked Auto-Encoder For Pre-Training Retrieval-Oriented Language Models	Nov 16, 2022	Dimensionality ReductionInformation Retrieval	CodeCode Available	2
Holistic Evaluation of Language Models	Nov 16, 2022	FairnessQuestion Answering	CodeCode Available	4
Galactica: A Large Language Model for Science	Nov 16, 2022	AnachronismsBias Detection	CodeCode Available	4
Cheater's Bowl: Human vs. Computer Search Strategies for Open-Domain Question Answering	Nov 15, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
PromptCap: Prompt-Guided Task-Aware Image Captioning	Nov 15, 2022	Image CaptioningLanguage Modelling	CodeCode Available	1
A Survey for Efficient Open Domain Question Answering	Nov 15, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
MapQA: A Dataset for Question Answering on Choropleth Maps	Nov 15, 2022	ArticlesQuestion Answering	CodeCode Available	1
Empowering Language Models with Knowledge Graph Reasoning for Question Answering	Nov 15, 2022	Knowledge GraphsLanguage Modeling	—Unverified	0
A Comparative Study of Question Answering over Knowledge Bases	Nov 15, 2022	DiversityQuestion Answering	CodeCode Available	0
Introducing Semantics into Speech Encoders	Nov 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 100 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified