Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6401–6425 of 10817 papers

Title	Date	Tasks	Status
Answer Consolidation: Formulation and Benchmarking	Apr 29, 2022	BenchmarkingQuestion Answering	CodeCode Available
Inferring Implicit Relations in Complex Questions with Language Models	Apr 28, 2022	Implicit RelationsQuestion Answering	CodeCode Available
Adaptable Text Matching via Meta-Weight Regulator	Apr 27, 2022	Meta-LearningNatural Language Inference	—Unverified
Better Query Graph Selection for Knowledge Base Question Answering	Apr 27, 2022	Knowledge Base Question AnsweringQuestion Answering	—Unverified
Towards Teachable Reasoning Systems: Using a Dynamic Memory of User Feedback for Continual System Improvement	Apr 27, 2022	Question Answering	—Unverified
A Method of Query Graph Reranking for Knowledge Base Question Answering	Apr 27, 2022	Graph RankingKnowledge Base Question Answering	—Unverified
Science Checker: Extractive-Boolean Question Answering For Scientific Fact Checking	Apr 26, 2022	ArticlesExtractive Question-Answering	CodeCode Available
Rethinking Multi-Modal Alignment in Video Question Answering from Feature and Sample Perspectives	Apr 25, 2022	Question AnsweringVideo Question Answering	—Unverified
Conversational Question Answering on Heterogeneous Sources	Apr 25, 2022	Conversational Question AnsweringDecoder	—Unverified
MEKER: Memory Efficient Knowledge Embedding Representation for Link Prediction and Question Answering	Apr 22, 2022	Knowledge GraphsLink Prediction	—Unverified
Multimodal Adaptive Distillation for Leveraging Unimodal Encoders for Vision-Language Tasks	Apr 22, 2022	Question AnsweringVisual Commonsense Reasoning	—Unverified
A Summary of the ALQAC 2021 Competition	Apr 22, 2022	Information RetrievalQuestion Answering	—Unverified
Benchmarking Answer Verification Methods for Question Answering-Based Summarization Evaluation Metrics	Apr 21, 2022	AttributeBenchmarking	—Unverified
Clotho-AQA: A Crowdsourced Dataset for Audio Question Answering	Apr 20, 2022	Audio Question AnsweringQuestion Answering	—Unverified
Synthetic Target Domain Supervision for Open Retrieval QA	Apr 20, 2022	Passage RetrievalQuestion Answering	—Unverified
Where Was COVID-19 First Discovered? Designing a Question-Answering System for Pandemic Situations	Apr 19, 2022	Information RetrievalMisinformation	—Unverified
Retrieval Enhanced Data Augmentation for Question Answering on Privacy Policies	Apr 19, 2022	Data AugmentationDiversity	—Unverified
Multi-hop Question Answering	Apr 19, 2022	Multi-hop Question AnsweringQuestion Answering	—Unverified
CBR-iKB: A Case-Based Reasoning Approach for Question Answering over Incomplete Knowledge Bases	Apr 18, 2022	Knowledge Base Question AnsweringQuestion Answering	—Unverified
LayoutLMv3: Pre-training for Document AI with Unified Text and Image Masking	Apr 18, 2022	cross-modal alignmentDocument AI	CodeCode Available
WikiOmnia: generative QA corpus on the whole Russian Wikipedia	Apr 17, 2022	Question Answering	—Unverified
Attention Mechanism based Cognition-level Scene Understanding	Apr 17, 2022	Question AnsweringScene Understanding	—Unverified
Calibrating Trust of Multi-Hop Question Answering Systems with Decompositional Probes	Apr 16, 2022	Explanation GenerationMulti-hop Question Answering	—Unverified
Characterizing the Efficiency vs. Accuracy Trade-off for Long-Context NLP Models	Apr 15, 2022	DecoderPlaying the Game of 2048	CodeCode Available
Mixture of Experts for Biomedical Question Answering	Apr 15, 2022	Mixture-of-ExpertsQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 257 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified