Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5801–5850 of 10817 papers

Title	Date	Tasks	Status	Hype
Joint Answering and Explanation for Visual Commonsense Reasoning	Feb 25, 2022	Knowledge DistillationQuestion Answering	CodeCode Available	0
BERTVision -- A Parameter-Efficient Approach for Question Answering	Feb 24, 2022	GPUQuestion Answering	CodeCode Available	1
Measuring CLEVRness: Blackbox testing of Visual Reasoning Models	Feb 24, 2022	BenchmarkingDiagnostic	—Unverified	0
UnifiedQA-v2: Stronger Generalization via Broader Cross-Format Training	Feb 23, 2022	Question Answering	CodeCode Available	2
Knowledge Base Question Answering by Case-based Reasoning over Subgraphs	Feb 22, 2022	Knowledge Base Question AnsweringQuestion Answering	CodeCode Available	1
OG-SGG: Ontology-Guided Scene Graph Generation. A Case Study in Transfer Learning for Telepresence Robotics	Feb 21, 2022	BIG-bench Machine LearningGraph Generation	CodeCode Available	0
Vision-Language Pre-Training with Triple Contrastive Learning	Feb 21, 2022	Contrastive Learningcross-modal alignment	CodeCode Available	2
(2.5+1)D Spatio-Temporal Scene Graphs for Video Question Answering	Feb 18, 2022	Question AnsweringSpatio-temporal Scene Graphs	—Unverified	0
SGPT: GPT Sentence Embeddings for Semantic Search	Feb 17, 2022	Argument RetrievalBiomedical Information Retrieval	CodeCode Available	2
Discovering Fine-Grained Semantics in Knowledge Graph Relations	Feb 17, 2022	Knowledge Graph CompletionKnowledge Graphs	—Unverified	0
ST-MoE: Designing Stable and Transferable Sparse Expert Models	Feb 17, 2022	ARCCommon Sense Reasoning	CodeCode Available	3
Question-Answer Sentence Graph for Joint Modeling Answer Selection	Feb 16, 2022	Answer SelectionQuestion Answering	—Unverified	0
ZeroGen: Efficient Zero-shot Learning via Dataset Generation	Feb 16, 2022	Data-free Knowledge DistillationDataset Generation	CodeCode Available	1
Privacy Preserving Visual Question Answering	Feb 15, 2022	Privacy PreservingQuestion Answering	—Unverified	0
MuLD: The Multitask Long Document Benchmark	Feb 15, 2022	Question AnsweringStyle change detection	CodeCode Available	1
Delving Deeper into Cross-lingual Visual Question Answering	Feb 15, 2022	Inductive BiasQuestion Answering	CodeCode Available	0
XAI for Transformers: Better Explanations through Conservative Propagation	Feb 15, 2022	Explainable Artificial Intelligence (XAI)Question Answering	CodeCode Available	1
Tomayto, Tomahto. Beyond Token-level Answer Equivalence for Question Answering Evaluation	Feb 15, 2022	Question Answering	CodeCode Available	1
Partially Fake Audio Detection by Self-attention-based Fake Span Discovery	Feb 14, 2022	Open-Ended Question AnsweringQuestion Answering	—Unverified	0
An experimental study of the vision-bottleneck in VQA	Feb 14, 2022	ObjectQuestion Answering	—Unverified	0
QA4QG: Using Question Answering to Constrain Multi-Hop Question Generation	Feb 14, 2022	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
PQuAD: A Persian Question Answering Dataset	Feb 13, 2022	ArticlesDiversity	—Unverified	0
Recognition-free Question Answering on Handwritten Document Collections	Feb 12, 2022	Question AnsweringRetrieval	—Unverified	0
FedQAS: Privacy-aware machine reading comprehension with federated learning	Feb 9, 2022	Conversational Question AnsweringFederated Learning	CodeCode Available	0
Can Open Domain Question Answering Systems Answer Visual Knowledge Questions?	Feb 9, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
RNN Transducers for Nested Named Entity Recognition with constraints on alignment for long sequences	Feb 8, 2022	named-entity-recognitionNamed Entity Recognition	—Unverified	0
NEWSKVQA: Knowledge-Aware News Video Question Answering	Feb 8, 2022	Common Sense ReasoningManagement	—Unverified	0
Survey of Hallucination in Natural Language Generation	Feb 8, 2022	Abstractive Text SummarizationData-to-Text Generation	—Unverified	0
Integrating question answering and text-to-SQL in Portuguese	Feb 8, 2022	Question AnsweringText to SQL	CodeCode Available	0
Towards Loosely-Coupling Knowledge Graph Embeddings and Ontology-based Reasoning	Feb 7, 2022	Graph EmbeddingKnowledge Graph Completion	—Unverified	0
Pirá: A Bilingual Portuguese-English Dataset for Question-Answering about the Ocean	Feb 4, 2022	Information RetrievalMachine Translation	CodeCode Available	0
A Dataset for Interactive Vision-Language Navigation with Unknown Command Feasibility	Feb 4, 2022	Common Sense ReasoningQuestion Answering	CodeCode Available	1
Grounding Answers for Visual Questions Asked by Visually Impaired People	Feb 4, 2022	Question AnsweringVisual Question Answering	CodeCode Available	0
JaQuAD: Japanese Question Answering Dataset for Machine Reading Comprehension	Feb 3, 2022	ArticlesMachine Reading Comprehension	CodeCode Available	1
GatorTron: A Large Clinical Language Model to Unlock Patient Information from Unstructured Electronic Health Records	Feb 2, 2022	Clinical Concept ExtractionLanguage Modeling	—Unverified	0
Active Learning Over Multiple Domains in Natural Language Tasks	Feb 1, 2022	Active LearningQuestion Answering	—Unverified	0
Semantic Annotation and Querying Framework based on Semi-structured Ayurvedic Text	Feb 1, 2022	Information RetrievalQuestion Answering	—Unverified	0
When Do Flat Minima Optimizers Work?	Feb 1, 2022	BenchmarkingGraph Learning	CodeCode Available	1
QALD-9-plus: A Multilingual Dataset for Question Answering over DBpedia and Wikidata Translated by Native Speakers	Jan 31, 2022	Graph Question AnsweringQuestion Answering	CodeCode Available	1
Learning Representations of Entities and Relations	Jan 31, 2022	Fact CheckingInformation Retrieval	—Unverified	0
Compositionality as Lexical Symmetry	Jan 30, 2022	Data AugmentationInductive Bias	CodeCode Available	0
A Dataset for Medical Instructional Video Classification and Question Answering	Jan 30, 2022	ClassificationQuestion Answering	CodeCode Available	1
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models	Jan 28, 2022	Common Sense ReasoningGSM8K	CodeCode Available	6
TableQuery: Querying tabular data with natural language	Jan 27, 2022	Deep LearningNatural Language Queries	CodeCode Available	2
Clinical-Longformer and Clinical-BigBird: Transformers for long clinical sequences	Jan 27, 2022	Clinical KnowledgeDocument Classification	CodeCode Available	1
Transformer Module Networks for Systematic Generalization in Visual Question Answering	Jan 27, 2022	Question AnsweringSystematic Generalization	CodeCode Available	0
Reasoning Like Program Executors	Jan 27, 2022	Logical ReasoningMath	—Unverified	0
IGLUE: A Benchmark for Transfer Learning across Modalities, Tasks, and Languages	Jan 27, 2022	Cross-Modal RetrievalFew-Shot Learning	CodeCode Available	1
Addressing Issues of Cross-Linguality in Open-Retrieval Question Answering Systems For Emergent Domains	Jan 26, 2022	ArticlesQuestion Answering	CodeCode Available	0
Learning to Compose Diversified Prompts for Image Emotion Classification	Jan 26, 2022	ClassificationEmotion Classification	—Unverified	0

Show:10 25 50

← PrevPage 117 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified