Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1451–1475 of 10817 papers

Title	Date	Tasks	Status	Hype
Towards Improving Faithfulness in Abstractive Summarization	Oct 4, 2022	Abstractive Text SummarizationDecoder	CodeCode Available	1
Recitation-Augmented Language Models	Oct 4, 2022	Natural QuestionsQuestion Answering	CodeCode Available	1
Logical Form Generation via Multi-task Learning for Complex Question Answering over Knowledge Bases	Oct 1, 2022	Entity DisambiguationForm	CodeCode Available	1
Linearly Mapping from Image to Text Space	Sep 30, 2022	Image CaptioningImage to text	CodeCode Available	1
DecAF: Joint Decoding of Answers and Logical Forms for Question Answering over Knowledge Bases	Sep 30, 2022	Entity LinkingQuestion Answering	CodeCode Available	1
TVLT: Textless Vision-Language Transformer	Sep 28, 2022	Automatic Speech Recognition (ASR)Image Retrieval	CodeCode Available	1
Towards Explainable 3D Grounded Visual Question Answering: A New Benchmark and Strong Baseline	Sep 24, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
Variational Open-Domain Question Answering	Sep 23, 2022	Language ModellingMedQA	CodeCode Available	1
Adapting Pretrained Text-to-Text Models for Long Text Sequences	Sep 21, 2022	Long-range modelingQuestion Answering	CodeCode Available	1
Dynamic Relevance Graph Network for Knowledge-Aware Question Answering	Sep 20, 2022	Graph Neural NetworkQuestion Answering	CodeCode Available	1
CodeQueries: A Dataset of Semantic Queries over Code	Sep 17, 2022	AttributeExtractive Question-Answering	CodeCode Available	1
Answering Numerical Reasoning Questions in Table-Text Hybrid Contents with Graph-based Encoder and Tree-based Decoder	Sep 16, 2022	DecoderModels Alignment	CodeCode Available	1
ScreenQA: Large-Scale Question-Answer Pairs over Mobile App Screenshots	Sep 16, 2022	BenchmarkingQuestion Answering	CodeCode Available	1
MaXM: Towards Multilingual Visual Question Answering	Sep 12, 2022	Question AnsweringTranslation	CodeCode Available	1
An Empirical Study of End-to-End Video-Language Transformers with Masked Visual Modeling	Sep 4, 2022	Fill MaskOptical Flow Estimation	CodeCode Available	1
Why Do Neural Language Models Still Need Commonsense Knowledge to Handle Semantic Variations in Question Answering?	Sep 1, 2022	DiagnosticQuestion Answering	CodeCode Available	1
Universal Vision-Language Dense Retrieval: Learning A Unified Representation Space for Multi-Modal Retrieval	Sep 1, 2022	Image RetrievalOpen-Domain Question Answering	CodeCode Available	1
Symbolic Replay: Scene Graph as Prompt for Continual Learning on VQA Task	Aug 24, 2022	Continual LearningQuestion Answering	CodeCode Available	1
Prompting as Probing: Using Language Models for Knowledge Base Construction	Aug 23, 2022	Knowledge Base ConstructionLanguage Modeling	CodeCode Available	1
Locate Then Ask: Interpretable Stepwise Reasoning for Multi-hop Question Answering	Aug 22, 2022	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
UKP-SQuARE v2: Explainability and Adversarial Attacks for Trustworthy QA	Aug 19, 2022	Adversarial AttackExplainable Models	CodeCode Available	1
Pre-training Tasks for User Intent Detection and Embedding Retrieval in E-commerce Search	Aug 12, 2022	CPUIntent Detection	CodeCode Available	1
CLEVR-Math: A Dataset for Compositional Language, Visual and Mathematical Reasoning	Aug 10, 2022	MathMathematical Reasoning	CodeCode Available	1
ChiQA: A Large Scale Image-based Real-World Question Answering Dataset for Multi-Modal Understanding	Aug 5, 2022	Image RetrievalQuestion Answering	CodeCode Available	1
Generative Bias for Robust Visual Question Answering	Aug 1, 2022	Knowledge DistillationQuestion Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 59 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified