Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5651–5700 of 10817 papers

Title	Date	Tasks	Status	Hype
Reliable Visual Question Answering: Abstain Rather Than Answer Incorrectly	Apr 28, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
GRIT: General Robust Image Task Benchmark	Apr 28, 2022	Instance SegmentationKeypoint Detection	CodeCode Available	1
Adaptable Text Matching via Meta-Weight Regulator	Apr 27, 2022	Meta-LearningNatural Language Inference	—Unverified	0
Towards Teachable Reasoning Systems: Using a Dynamic Memory of User Feedback for Continual System Improvement	Apr 27, 2022	Question Answering	—Unverified	0
Better Query Graph Selection for Knowledge Base Question Answering	Apr 27, 2022	Knowledge Base Question AnsweringQuestion Answering	—Unverified	0
A Method of Query Graph Reranking for Knowledge Base Question Answering	Apr 27, 2022	Graph RankingKnowledge Base Question Answering	—Unverified	0
Science Checker: Extractive-Boolean Question Answering For Scientific Fact Checking	Apr 26, 2022	ArticlesExtractive Question-Answering	CodeCode Available	0
Rethinking Multi-Modal Alignment in Video Question Answering from Feature and Sample Perspectives	Apr 25, 2022	Question AnsweringVideo Question Answering	—Unverified	0
Conversational Question Answering on Heterogeneous Sources	Apr 25, 2022	Conversational Question AnsweringDecoder	—Unverified	0
KALA: Knowledge-Augmented Language Model Adaptation	Apr 22, 2022	Domain AdaptationGeneral Knowledge	CodeCode Available	1
Multimodal Adaptive Distillation for Leveraging Unimodal Encoders for Vision-Language Tasks	Apr 22, 2022	Question AnsweringVisual Commonsense Reasoning	—Unverified	0
Hypergraph Transformer: Weakly-supervised Multi-hop Reasoning for Knowledge-based Visual Question Answering	Apr 22, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
A Summary of the ALQAC 2021 Competition	Apr 22, 2022	Information RetrievalQuestion Answering	—Unverified	0
MEKER: Memory Efficient Knowledge Embedding Representation for Link Prediction and Question Answering	Apr 22, 2022	Knowledge GraphsLink Prediction	—Unverified	0
Benchmarking Answer Verification Methods for Question Answering-Based Summarization Evaluation Metrics	Apr 21, 2022	AttributeBenchmarking	—Unverified	0
Clotho-AQA: A Crowdsourced Dataset for Audio Question Answering	Apr 20, 2022	Audio Question AnsweringQuestion Answering	—Unverified	0
Synthetic Target Domain Supervision for Open Retrieval QA	Apr 20, 2022	Passage RetrievalQuestion Answering	—Unverified	0
Attention in Reasoning: Dataset, Analysis, and Modeling	Apr 20, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
LingYi: Medical Conversational Question Answering System based on Multi-modal Knowledge Graphs	Apr 20, 2022	Conversational Question AnsweringDialogue Generation	CodeCode Available	1
Retrieval Enhanced Data Augmentation for Question Answering on Privacy Policies	Apr 19, 2022	Data AugmentationDiversity	—Unverified	0
Multi-hop Question Answering	Apr 19, 2022	Multi-hop Question AnsweringQuestion Answering	—Unverified	0
Where Was COVID-19 First Discovered? Designing a Question-Answering System for Pandemic Situations	Apr 19, 2022	Information RetrievalMisinformation	—Unverified	0
CBR-iKB: A Case-Based Reasoning Approach for Question Answering over Incomplete Knowledge Bases	Apr 18, 2022	Knowledge Base Question AnsweringQuestion Answering	—Unverified	0
LayoutLMv3: Pre-training for Document AI with Unified Text and Image Masking	Apr 18, 2022	cross-modal alignmentDocument AI	CodeCode Available	0
StepGame: A New Benchmark for Robust Multi-Hop Spatial Reasoning in Texts	Apr 18, 2022	Question AnsweringSpatial Reasoning	CodeCode Available	1
TABi: Type-Aware Bi-Encoders for Open-Domain Entity Retrieval	Apr 18, 2022	Entity RetrievalFact Checking	CodeCode Available	1
ArcaneQA: Dynamic Program Induction and Contextualized Encoding for Knowledge Base Question Answering	Apr 17, 2022	Knowledge Base Question AnsweringProgram induction	CodeCode Available	1
Attention Mechanism based Cognition-level Scene Understanding	Apr 17, 2022	Question AnsweringScene Understanding	—Unverified	0
WikiOmnia: generative QA corpus on the whole Russian Wikipedia	Apr 17, 2022	Question Answering	—Unverified	0
Calibrating Trust of Multi-Hop Question Answering Systems with Decompositional Probes	Apr 16, 2022	Explanation GenerationMulti-hop Question Answering	—Unverified	0
Semantic Structure based Query Graph Prediction for Question Answering over Knowledge Graph	Apr 15, 2022	Graph GenerationQuestion Answering	—Unverified	0
Characterizing the Efficiency vs. Accuracy Trade-off for Long-Context NLP Models	Apr 15, 2022	DecoderPlaying the Game of 2048	CodeCode Available	0
MoEBERT: from BERT to Mixture-of-Experts via Importance-Guided Adaptation	Apr 15, 2022	Knowledge DistillationMixture-of-Experts	CodeCode Available	1
Improving Passage Retrieval with Zero-Shot Question Generation	Apr 15, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Mixture of Experts for Biomedical Question Answering	Apr 15, 2022	Mixture-of-ExpertsQuestion Answering	—Unverified	0
Towards Fine-grained Causal Reasoning and QA	Apr 15, 2022	Question AnsweringSentence	CodeCode Available	1
Improving Cross-Modal Understanding in Visual Dialog via Contrastive Learning	Apr 15, 2022	Contrastive LearningQuestion Answering	—Unverified	0
Exploring Dual Encoder Architectures for Question Answering	Apr 14, 2022	Information RetrievalQuestion Answering	CodeCode Available	1
Measuring Compositional Consistency for Video Question Answering	Apr 14, 2022	Question AnsweringVideo Question Answering	—Unverified	0
XLMRQA: Open-Domain Question Answering on Vietnamese Wikipedia-based Textual Knowledge Source	Apr 14, 2022	Information RetrievalMachine Reading Comprehension	—Unverified	0
Can Question Rewriting Help Conversational Question Answering?	Apr 13, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
AGQA 2.0: An Updated Benchmark for Compositional Spatio-Temporal Reasoning	Apr 12, 2022	Question Answering	—Unverified	0
ASQA: Factoid Questions Meet Long-Form Answers	Apr 12, 2022	FormQuestion Answering	CodeCode Available	0
Solving Price Per Unit Problem Around the World: Formulating Fact Extraction as Question Answering	Apr 12, 2022	named-entity-recognitionNamed Entity Recognition	—Unverified	0
XQA-DST: Multi-Domain and Multi-Lingual Dialogue State Tracking	Apr 12, 2022	Cross-Lingual TransferDialogue State Tracking	CodeCode Available	0
MuCoT: Multilingual Contrastive Training for Question-Answering in Low-resource Languages	Apr 12, 2022	Question Answering	CodeCode Available	0
Answering Count Queries with Explanatory Evidence	Apr 11, 2022	Question Answering	CodeCode Available	0
Uniform Complexity for Text Generation	Apr 11, 2022	Machine TranslationQuestion Answering	CodeCode Available	0
Metaethical Perspectives on 'Benchmarking' AI Ethics	Apr 11, 2022	BenchmarkingEthics	—Unverified	0
Breaking Character: Are Subwords Good Enough for MRLs After All?	Apr 10, 2022	AllExtractive Question-Answering	—Unverified	0

Show:10 25 50

← PrevPage 114 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified