Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5051–5100 of 10817 papers

Title	Date	Tasks	Status	Hype
CS1QA: A Dataset for Assisting Code-based Question Answering in an Introductory Programming Course	Oct 26, 2022	Question Answering	CodeCode Available	1
Look to the Right: Mitigating Relative Position Bias in Extractive Question Answering	Oct 26, 2022	Extractive Question-AnsweringPosition	—Unverified	0
Generalization Differences between End-to-End and Neuro-Symbolic Vision-Language Reasoning Systems	Oct 26, 2022	Question AnsweringVisual Question Answering	—Unverified	0
Compressing And Debiasing Vision-Language Pre-Trained Models for Visual Question Answering	Oct 26, 2022	Question AnsweringVisual Question Answering	CodeCode Available	0
RoMQA: A Benchmark for Robust, Multi-evidence, Multi-answer Question Answering	Oct 25, 2022	Question AnsweringRetrieval	CodeCode Available	1
Bridging the Training-Inference Gap for Dense Phrase Retrieval	Oct 25, 2022	Open-Domain Question AnsweringPassage Retrieval	—Unverified	0
Rich Knowledge Sources Bring Complex Knowledge Conflicts: Recalibrating Models to Reflect Conflicting Evidence	Oct 25, 2022	Language ModelingLanguage Modelling	—Unverified	0
Learning by Hallucinating: Vision-Language Pre-training with Weak Supervision	Oct 24, 2022	cross-modal alignmentCross-Modal Retrieval	—Unverified	0
Speeding Up Question Answering Task of Language Models via Inverted Index	Oct 24, 2022	Question Answering	—Unverified	0
ReaRev: Adaptive Reasoning for Question Answering over Knowledge Graphs	Oct 24, 2022	Graph Question AnsweringKnowledge Graphs	CodeCode Available	1
VLC-BERT: Visual Question Answering with Contextualized Commonsense Knowledge	Oct 24, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
Event-Centric Question Answering via Contrastive Learning and Invertible Event Transformation	Oct 24, 2022	Contrastive LearningQuestion Answering	CodeCode Available	0
Multi-Type Conversational Question-Answer Generation with Closed-ended and Unanswerable Questions	Oct 24, 2022	Answer GenerationConversational Question Answering	—Unverified	0
TIARA: Multi-grained Retrieval for Robust Question Answering over Large Knowledge Bases	Oct 24, 2022	Question AnsweringRetrieval	CodeCode Available	0
RSVG: Exploring Data and Models for Visual Grounding on Remote Sensing Data	Oct 23, 2022	Image CaptioningImage-text Retrieval	—Unverified	0
TAPE: Assessing Few-shot Russian Language Understanding	Oct 23, 2022	Adversarial AttackAdversarial Text	CodeCode Available	0
Cross-document Event Coreference Search: Task, Dataset and Modeling	Oct 23, 2022	Coreference ResolutionCross Document Coreference Resolution	CodeCode Available	1
Knowledge Transfer from Answer Ranking to Answer Generation	Oct 23, 2022	Answer GenerationQuestion Answering	—Unverified	0
Exploring The Landscape of Distributional Robustness for Question Answering Models	Oct 22, 2022	In-Context LearningQuestion Answering	—Unverified	0
P^3LM: Probabilistically Permuted Prophet Language Modeling for Generative Pre-Training	Oct 22, 2022	Conversational Question AnsweringDecoder	—Unverified	0
ReasTAP: Injecting Table Reasoning Skills During Pre-training via Synthetic Reasoning Examples	Oct 22, 2022	Fact VerificationQuestion Answering	CodeCode Available	1
Open-domain Question Answering via Chain of Reasoning over Heterogeneous Knowledge	Oct 22, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Prompt-Tuning Can Be Much Better Than Fine-Tuning on Cross-lingual Understanding With Multilingual Language Models	Oct 22, 2022	Cross-Lingual TransferNatural Language Understanding	CodeCode Available	1
Leveraging Large Language Models for Multiple Choice Question Answering	Oct 22, 2022	Answer SelectionMultiple-choice	CodeCode Available	1
Varifocal Question Generation for Fact-checking	Oct 22, 2022	Fact CheckingQuestion Answering	CodeCode Available	0
Entailer: Answering Questions with Faithful and Truthful Chains of Reasoning	Oct 21, 2022	Question Answering	—Unverified	0
GraphNeT: Graph neural networks for neutrino telescope event reconstruction	Oct 21, 2022	Question Answering	CodeCode Available	1
Efficiently Tuned Parameters are Task Embeddings	Oct 21, 2022	Question AnsweringText Classification	CodeCode Available	1
LiteVL: Efficient Video-Language Learning with Enhanced Spatial-Temporal Modeling	Oct 21, 2022	Language ModelingLanguage Modelling	—Unverified	0
LittleBird: Efficient Faster & Longer Transformer for Question Answering	Oct 21, 2022	Language ModellingQuestion Answering	—Unverified	0
InforMask: Unsupervised Informative Masking for Language Model Pretraining	Oct 21, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Multi-view Semantic Matching of Question retrieval using Fine-grained Semantic Representations	Oct 21, 2022	Keyword ExtractionQuestion Answering	—Unverified	0
PoseScript: Linking 3D Human Poses and Natural Language	Oct 21, 2022	Cross-Modal RetrievalImage Captioning	CodeCode Available	2
WikiWhy: Answering and Explaining Cause-and-Effect Questions	Oct 21, 2022	Question Answering	—Unverified	0
Scaling Instruction-Finetuned Language Models	Oct 20, 2022	Coreference ResolutionCross-Lingual Question Answering	CodeCode Available	3
Pre-training Language Models with Deterministic Factual Knowledge	Oct 20, 2022	Knowledge ProbingQuestion Answering	—Unverified	0
Composing Ensembles of Pre-trained Models via Iterative Consensus	Oct 20, 2022	Arithmetic ReasoningImage Generation	—Unverified	0
Large Language Models Can Self-Improve	Oct 20, 2022	Arithmetic ReasoningCommon Sense Reasoning	—Unverified	0
Transcending Scaling Laws with 0.1% Extra Compute	Oct 20, 2022	Arithmetic ReasoningCross-Lingual Question Answering	—Unverified	0
Perception Test: A Diagnostic Benchmark for Multimodal Models	Oct 19, 2022	DiagnosticMultiple-choice	CodeCode Available	2
Two-Turn Debate Doesn't Help Humans Answer Hard Reading Comprehension Questions	Oct 19, 2022	Language ModelingLanguage Modelling	—Unverified	0
QA Domain Adaptation using Hidden Space Augmentation and Self-Supervised Contrastive Adaptation	Oct 19, 2022	Contrastive LearningData Augmentation	CodeCode Available	0
Image Semantic Relation Generation	Oct 19, 2022	Image RetrievalImage Segmentation	—Unverified	0
BioGPT: Generative Pre-trained Transformer for Biomedical Text Generation and Mining	Oct 19, 2022	Document ClassificationLanguage Modelling	CodeCode Available	4
MuGER^2: Multi-Granularity Evidence Retrieval and Reasoning for Hybrid Question Answering	Oct 19, 2022	NavigateQuestion Answering	CodeCode Available	2
Dense but Efficient VideoQA for Intricate Compositional Reasoning	Oct 19, 2022	Question AnsweringVideo Question Answering	—Unverified	0
Incorporating Relevance Feedback for Information-Seeking Retrieval using Few-Shot Document Re-Ranking	Oct 19, 2022	Argument RetrievalInformation Retrieval	CodeCode Available	1
Aligning MAGMA by Few-Shot Learning and Finetuning	Oct 18, 2022	Few-Shot LearningImage Captioning	—Unverified	0
Entity-Focused Dense Passage Retrieval for Outside-Knowledge Visual Question Answering	Oct 18, 2022	Passage RetrievalQuestion Answering	—Unverified	0
ELASTIC: Numerical Reasoning with Adaptive Symbolic Compiler	Oct 18, 2022	Math Word Problem SolvingQuestion Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 102 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified