Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5301–5350 of 10817 papers

Title	Date	Tasks	Status	Hype
UnCommonSense: Informative Negative Knowledge about Everyday Concepts	Aug 19, 2022	InformativenessQuestion Answering	—Unverified	0
VLMAE: Vision-Language Masked Autoencoder	Aug 19, 2022	Image-text RetrievalLanguage Modeling	—Unverified	0
UKP-SQuARE v2: Explainability and Adversarial Attacks for Trustworthy QA	Aug 19, 2022	Adversarial AttackExplainable Models	CodeCode Available	1
Quantifying the Knowledge in a DNN to Explain Knowledge Distillation for Classification	Aug 18, 2022	3D Point Cloud ClassificationClassification	—Unverified	0
Knowledge Graph Curation: A Practical Framework	Aug 17, 2022	Knowledge GraphsMissing Values	—Unverified	0
Understanding Attention for Vision-and-Language Tasks	Aug 17, 2022	Image GenerationImage Retrieval	CodeCode Available	0
ILLUME: Rationalizing Vision-Language Models through Human Interactions	Aug 17, 2022	Image CaptioningQuestion Answering	CodeCode Available	0
NECE: Narrative Event Chain Extraction Toolkit	Aug 17, 2022	Question Answering	—Unverified	0
Steps to Knowledge Graphs Quality Assessment	Aug 16, 2022	Knowledge GraphsQuestion Answering	—Unverified	0
Continuous Active Learning Using Pretrained Transformers	Aug 15, 2022	Active LearningInformation Retrieval	—Unverified	0
An Answer Verbalization Dataset for Conversational Question Answerings over Knowledge Graphs	Aug 13, 2022	Answer GenerationConversational Question Answering	—Unverified	0
ForecastTKGQuestions: A Benchmark for Temporal Question Answering and Forecasting over Temporal Knowledge Graphs	Aug 12, 2022	Knowledge GraphsQuestion Answering	CodeCode Available	0
Pre-training Tasks for User Intent Detection and Embedding Retrieval in E-commerce Search	Aug 12, 2022	CPUIntent Detection	CodeCode Available	1
Aesthetic Visual Question Answering of Photographs	Aug 10, 2022	Question AnsweringSentiment Analysis	—Unverified	0
CLEVR-Math: A Dataset for Compositional Language, Visual and Mathematical Reasoning	Aug 10, 2022	MathMathematical Reasoning	CodeCode Available	1
Unsupervised Question Clarity Prediction Through Retrieved Item Coherency	Aug 9, 2022	Conversational Question AnsweringPrediction	—Unverified	0
Is this Change the Answer to that Problem? Correlating Descriptions of Bug and Code Changes for Evaluating Patch Correctness	Aug 8, 2022	Question Answering	CodeCode Available	0
Atlas: Few-shot Learning with Retrieval Augmented Language Models	Aug 5, 2022	Fact CheckingFew-Shot Learning	CodeCode Available	2
ChiQA: A Large Scale Image-based Real-World Question Answering Dataset for Multi-Modal Understanding	Aug 5, 2022	Image RetrievalQuestion Answering	CodeCode Available	1
Low-Resource Dense Retrieval for Open-Domain Question Answering: A Comprehensive Survey	Aug 5, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Simplifying Sparse Expert Recommendation by Revisiting Graph Diffusion	Aug 4, 2022	Community Question AnsweringQuestion Answering	—Unverified	0
AlexaTM 20B: Few-Shot Learning Using a Large-Scale Multilingual Seq2Seq Model	Aug 2, 2022	Causal Language ModelingCommon Sense Reasoning	CodeCode Available	2
Active entailment encoding for explanation tree construction using parsimonious generation of hard negatives	Aug 2, 2022	Explanation GenerationQuestion Answering	—Unverified	0
Video Question Answering with Iterative Video-Text Co-Tokenization	Aug 1, 2022	Question AnsweringVideo Question Answering	—Unverified	0
Generative Bias for Robust Visual Question Answering	Aug 1, 2022	Knowledge DistillationQuestion Answering	CodeCode Available	1
Neural Knowledge Bank for Pretrained Transformers	Jul 31, 2022	Language ModelingLanguage Modelling	—Unverified	0
Neuro-Symbolic Learning: Principles and Applications in Ophthalmology	Jul 31, 2022	Common Sense ReasoningImage Captioning	—Unverified	0
Face-to-Face Contrastive Learning for Social Intelligence Question-Answering	Jul 29, 2022	Contrastive LearningGraph Neural Network	—Unverified	0
Sequence to sequence pretraining for a less-resourced Slovenian language	Jul 28, 2022	Language ModelingLanguage Modelling	CodeCode Available	0
RealTime QA: What's the Answer Right Now?	Jul 27, 2022	Information RetrievalQuestion Answering	CodeCode Available	1
Uncertainty-based Visual Question Answering: Estimating Semantic Inconsistency between Image and Knowledge Base	Jul 27, 2022	Question AnsweringSemantic Similarity	—Unverified	0
Equivariant and Invariant Grounding for Video Question Answering	Jul 26, 2022	Question AnsweringVideo Question Answering	CodeCode Available	1
Cross-Modal Causal Relational Reasoning for Event-Level Visual Question Answering	Jul 26, 2022	Causal InferenceQuestion Answering	CodeCode Available	1
LaKo: Knowledge-driven Visual Question Answering via Late Knowledge-to-Text Injection	Jul 26, 2022	DecoderKnowledge Graphs	CodeCode Available	1
WinoGAViL: Gamified Association Benchmark to Challenge Vision-and-Language Models	Jul 25, 2022	Common Sense ReasoningGeneral Knowledge	CodeCode Available	0
Is GPT-3 all you need for Visual Question Answering in Cultural Heritage?	Jul 25, 2022	AllQuestion Answering	—Unverified	0
Towards Complex Document Understanding By Discrete Reasoning	Jul 25, 2022	document understandingQuestion Answering	—Unverified	0
Visual Perturbation-aware Collaborative Learning for Overcoming the Language Prior Problem	Jul 24, 2022	DiagnosticQuestion Answering	—Unverified	0
μKG: A Library for Multi-source Knowledge Graph Embeddings and Applications	Jul 23, 2022	Entity AlignmentEntity Typing	CodeCode Available	1
Semantic-aware Modular Capsule Routing for Visual Question Answering	Jul 21, 2022	Question AnsweringVisual Question Answering	—Unverified	0
Step by step: a hierarchical framework for multi-hop knowledge graph reasoning with reinforcement learning	Jul 19, 2022	Hierarchical Reinforcement LearningKnowledge Graphs	CodeCode Available	0
On the Usability of Transformers-based models for a French Question-Answering task	Jul 19, 2022	Cross-Lingual TransferData Augmentation	—Unverified	0
PiC: A Phrase-in-Context Dataset for Phrase Understanding and Semantic Search	Jul 19, 2022	Information RetrievalNatural Language Understanding	CodeCode Available	0
Rethinking Data Augmentation for Robust Visual Question Answering	Jul 18, 2022	Data AugmentationKnowledge Distillation	CodeCode Available	1
Can large language models reason about medical questions?	Jul 17, 2022	MedQAMultiple-choice	CodeCode Available	1
An Overview of Distant Supervision for Relation Extraction with a Focus on Denoising and Pre-training Methods	Jul 17, 2022	DenoisingKnowledge Graph Completion	—Unverified	0
Clover: Towards A Unified Video-Language Alignment and Fusion Model	Jul 16, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Re2G: Retrieve, Rerank, Generate	Jul 13, 2022	Fact CheckingFact Verification	CodeCode Available	1
N-Grammer: Augmenting Transformers with latent n-grams	Jul 13, 2022	Common Sense ReasoningCoreference Resolution	CodeCode Available	4
3D Concept Grounding on Neural Fields	Jul 13, 2022	Instance SegmentationQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 107 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified