Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5901–5925 of 10817 papers

Title	Date	Tasks	Status
Logical Story Representations via FrameNet + Semantic Parsing	Jan 16, 2022	Formal LogicQuestion Answering	—Unverified
QAFactEval: Improved QA-Based Factual Consistency Evaluation for Summarization	Jan 16, 2022	Question AnsweringQuestion Generation	—Unverified
Divide and Conquer: Text Semantic Matching with Disentangled Keywords and Intents	Jan 16, 2022	Community Question AnsweringInformation Retrieval	—Unverified
Learning to Transpile AMR into SPARQL	Jan 16, 2022	Abstract Meaning RepresentationKnowledge Base Question Answering	—Unverified
Retrieving Visual Facts For Few-Shot Visual Question Answering	Jan 16, 2022	Language ModelingLanguage Modelling	—Unverified
Disaggregating Hops: Can We Guide a Multi-Hop Reasoning Language Model to Incrementally Learn at each Hop?	Jan 16, 2022	Language ModelingLanguage Modelling	—Unverified
MoEBERT: from BERT to Mixture-of-Experts via Importance-Guided Adaptation	Jan 16, 2022	Knowledge DistillationMixture-of-Experts	—Unverified
StoryQA: Story Grounded Question Answering Dataset	Jan 16, 2022	Question Answering	—Unverified
Bayesian Deep Learning for Interactive Community Question Answering	Jan 16, 2022	Bayesian OptimisationCommunity Question Answering	—Unverified
An Encoder Attribution Analysis for Dense Passage Retriever in Open-Domain Question Answering	Jan 16, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified
Knowledge Base Index Compression via Dimensionality and Precision Reduction	Jan 16, 2022	Dimensionality ReductionQuestion Answering	—Unverified
Task Formulation Matters When Learning Continuously: A Case Study in Visual Question Answering	Jan 16, 2022	Continual LearningIncremental Learning	—Unverified
Probing the Role of Positional Information in Vision-Language Models	Jan 16, 2022	Contrastive LearningImage-text matching	—Unverified
JointLK: Joint Reasoning with Language Models and Knowledge Graphs for Commonsense Question Answering	Jan 16, 2022	Knowledge GraphsQuestion Answering	—Unverified
Data Augmentation for Biomedical Factoid Question Answering	Jan 16, 2022	Data AugmentationInformation Retrieval	—Unverified
A Two-Stage Approach towards Generalization in Knowledge Base Question Answering	Jan 16, 2022	Knowledge Base Question AnsweringKnowledge Graphs	—Unverified
MANGO: Enhancing the Robustness of VQA Models via Adversarial Noise Generation	Jan 16, 2022	Logical ReasoningQuestion Answering	—Unverified
Incorporating Question Answering-Based Signals into Abstractive Summarization via Salient Span Selection	Jan 16, 2022	Abstractive Text SummarizationQuestion Answering	—Unverified
Improving Data Augmentation in Low-resource Question Answering with Active Learning in Multiple Stages	Jan 16, 2022	Active LearningAnswer Generation	—Unverified
Improved and Efficient Conversational Slot Labeling through Question Answering	Jan 16, 2022	Natural Language UnderstandingQuestion Answering	—Unverified
Cooperative Self-training of Machine Reading Comprehension	Jan 16, 2022	Extractive Question-AnsweringMachine Reading Comprehension	—Unverified
Mining Information from Event Structure Relation Graph for Event Argument Extraction	Jan 16, 2022	Event Argument ExtractionEvent Extraction	—Unverified
Context-guided Triple Matching for Multiple Choice Question Answering	Jan 16, 2022	BenchmarkingMultiple-choice	—Unverified
CONQRR: Conversational Query Rewriting for Retrieval with Reinforcement Learning	Jan 16, 2022	Conversational Question AnsweringPassage Retrieval	—Unverified
Mosaic Augmentation for Text: Cropping and Collaging as Cross-Domain Techniques	Jan 16, 2022	Abstractive Text SummarizationExtractive Question-Answering	—Unverified

Show:10 25 50

← PrevPage 237 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified