Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1451–1500 of 10817 papers

Title	Date	Tasks	Status	Hype
Towards Improving Faithfulness in Abstractive Summarization	Oct 4, 2022	Abstractive Text SummarizationDecoder	CodeCode Available	1
Recitation-Augmented Language Models	Oct 4, 2022	Natural QuestionsQuestion Answering	CodeCode Available	1
Logical Form Generation via Multi-task Learning for Complex Question Answering over Knowledge Bases	Oct 1, 2022	Entity DisambiguationForm	CodeCode Available	1
Linearly Mapping from Image to Text Space	Sep 30, 2022	Image CaptioningImage to text	CodeCode Available	1
DecAF: Joint Decoding of Answers and Logical Forms for Question Answering over Knowledge Bases	Sep 30, 2022	Entity LinkingQuestion Answering	CodeCode Available	1
TVLT: Textless Vision-Language Transformer	Sep 28, 2022	Automatic Speech Recognition (ASR)Image Retrieval	CodeCode Available	1
Towards Explainable 3D Grounded Visual Question Answering: A New Benchmark and Strong Baseline	Sep 24, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
Variational Open-Domain Question Answering	Sep 23, 2022	Language ModellingMedQA	CodeCode Available	1
Adapting Pretrained Text-to-Text Models for Long Text Sequences	Sep 21, 2022	Long-range modelingQuestion Answering	CodeCode Available	1
Dynamic Relevance Graph Network for Knowledge-Aware Question Answering	Sep 20, 2022	Graph Neural NetworkQuestion Answering	CodeCode Available	1
CodeQueries: A Dataset of Semantic Queries over Code	Sep 17, 2022	AttributeExtractive Question-Answering	CodeCode Available	1
Answering Numerical Reasoning Questions in Table-Text Hybrid Contents with Graph-based Encoder and Tree-based Decoder	Sep 16, 2022	DecoderModels Alignment	CodeCode Available	1
ScreenQA: Large-Scale Question-Answer Pairs over Mobile App Screenshots	Sep 16, 2022	BenchmarkingQuestion Answering	CodeCode Available	1
MaXM: Towards Multilingual Visual Question Answering	Sep 12, 2022	Question AnsweringTranslation	CodeCode Available	1
An Empirical Study of End-to-End Video-Language Transformers with Masked Visual Modeling	Sep 4, 2022	Fill MaskOptical Flow Estimation	CodeCode Available	1
Universal Vision-Language Dense Retrieval: Learning A Unified Representation Space for Multi-Modal Retrieval	Sep 1, 2022	Image RetrievalOpen-Domain Question Answering	CodeCode Available	1
Why Do Neural Language Models Still Need Commonsense Knowledge to Handle Semantic Variations in Question Answering?	Sep 1, 2022	DiagnosticQuestion Answering	CodeCode Available	1
Symbolic Replay: Scene Graph as Prompt for Continual Learning on VQA Task	Aug 24, 2022	Continual LearningQuestion Answering	CodeCode Available	1
Prompting as Probing: Using Language Models for Knowledge Base Construction	Aug 23, 2022	Knowledge Base ConstructionLanguage Modeling	CodeCode Available	1
Locate Then Ask: Interpretable Stepwise Reasoning for Multi-hop Question Answering	Aug 22, 2022	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
UKP-SQuARE v2: Explainability and Adversarial Attacks for Trustworthy QA	Aug 19, 2022	Adversarial AttackExplainable Models	CodeCode Available	1
Pre-training Tasks for User Intent Detection and Embedding Retrieval in E-commerce Search	Aug 12, 2022	CPUIntent Detection	CodeCode Available	1
CLEVR-Math: A Dataset for Compositional Language, Visual and Mathematical Reasoning	Aug 10, 2022	MathMathematical Reasoning	CodeCode Available	1
ChiQA: A Large Scale Image-based Real-World Question Answering Dataset for Multi-Modal Understanding	Aug 5, 2022	Image RetrievalQuestion Answering	CodeCode Available	1
Generative Bias for Robust Visual Question Answering	Aug 1, 2022	Knowledge DistillationQuestion Answering	CodeCode Available	1
RealTime QA: What's the Answer Right Now?	Jul 27, 2022	Information RetrievalQuestion Answering	CodeCode Available	1
Cross-Modal Causal Relational Reasoning for Event-Level Visual Question Answering	Jul 26, 2022	Causal InferenceQuestion Answering	CodeCode Available	1
LaKo: Knowledge-driven Visual Question Answering via Late Knowledge-to-Text Injection	Jul 26, 2022	DecoderKnowledge Graphs	CodeCode Available	1
Equivariant and Invariant Grounding for Video Question Answering	Jul 26, 2022	Question AnsweringVideo Question Answering	CodeCode Available	1
μKG: A Library for Multi-source Knowledge Graph Embeddings and Applications	Jul 23, 2022	Entity AlignmentEntity Typing	CodeCode Available	1
Rethinking Data Augmentation for Robust Visual Question Answering	Jul 18, 2022	Data AugmentationKnowledge Distillation	CodeCode Available	1
Can large language models reason about medical questions?	Jul 17, 2022	MedQAMultiple-choice	CodeCode Available	1
Clover: Towards A Unified Video-Language Alignment and Fusion Model	Jul 16, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Re2G: Retrieve, Rerank, Generate	Jul 13, 2022	Fact CheckingFact Verification	CodeCode Available	1
Video Graph Transformer for Video Question Answering	Jul 12, 2022	Question AnsweringRelation	CodeCode Available	1
ViQuAE, a Dataset for Knowledge-based Visual Question Answering about Named Entities	Jul 11, 2022	ArticlesFew-Shot Learning	CodeCode Available	1
Embedding Recycling for Language Models	Jul 11, 2022	Question AnsweringText Classification	CodeCode Available	1
OmniTab: Pretraining with Natural and Synthetic Data for Few-shot Table-based Question Answering	Jul 8, 2022	Question AnsweringRetrieval	CodeCode Available	1
CoQAR: Question Rewriting on CoQA	Jul 7, 2022	Conversational Question AnsweringForm	CodeCode Available	1
Weakly Supervised Grounding for VQA in Vision-Language Transformers	Jul 5, 2022	Question AnsweringRepresentation Learning	CodeCode Available	1
INSCIT: Information-Seeking Conversations with Mixed-Initiative Interactions	Jul 2, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
EA^2E: Improving Consistency with Event Awareness for Document-Level Argument Extraction	Jul 1, 2022	Event Argument ExtractionKnowledge Base Population	CodeCode Available	1
MultiSpanQA: A Dataset for Multi-Span Question Answering	Jul 1, 2022	Natural QuestionsQuestion Answering	CodeCode Available	1
CL-ReLKT: Cross-lingual Language Knowledge Transfer for Multilingual Retrieval Question Answering	Jul 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
A Unified End-to-End Retriever-Reader Framework for Knowledge-based VQA	Jun 30, 2022	Question AnsweringRetrieval	CodeCode Available	1
CC-Riddle: A Question Answering Dataset of Chinese Character Riddles	Jun 28, 2022	General KnowledgeLanguage Modelling	CodeCode Available	1
Consistency-preserving Visual Question Answering in Medical Imaging	Jun 27, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
PLATON: Pruning Large Transformer Models with Upper Confidence Bound of Weight Importance	Jun 25, 2022	image-classificationImage Classification	CodeCode Available	1
Surgical-VQA: Visual Question Answering in Surgical Scenes using Transformer	Jun 22, 2022	Question AnsweringSentence	CodeCode Available	1
EAGER: Asking and Answering Questions for Automatic Reward Shaping in Language-guided RL	Jun 20, 2022	Question AnsweringQuestion Generation	CodeCode Available	1

Show:10 25 50

← PrevPage 30 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified