Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5976–6000 of 10817 papers

Title	Date	Tasks	Status	Hype
MuMuQA: Multimedia Multi-Hop News Question Answering via Cross-Media Knowledge Extraction and Grounding	Dec 20, 2021	Answer GenerationArticles	CodeCode Available	1
General Greedy De-bias Learning	Dec 20, 2021	image-classificationImage Classification	CodeCode Available	0
Task-Oriented Multi-User Semantic Communications	Dec 19, 2021	Image RetrievalMachine Translation	—Unverified	0
DegreEmbed: incorporating entity embedding into logic rule learning for knowledge graph reasoning	Dec 18, 2021	Knowledge GraphsLink Prediction	CodeCode Available	1
Cascading Adaptors to Leverage English Data to Improve Performance of Question Answering for Low-Resource Languages	Dec 18, 2021	Question AnsweringTransfer Learning	CodeCode Available	0
Zero-shot and Few-shot Learning with Knowledge Graphs: A Comprehensive Survey	Dec 18, 2021	Data AugmentationFew-Shot Learning	—Unverified	0
Understanding Attention for Vision-and-Language Tasks	Dec 17, 2021	Image GenerationImage Retrieval	—Unverified	0
TASA: Twin Answer Sentences Attack for Adversarial Context Generation in Question Answering	Dec 17, 2021	Adversarial AttackQuestion Answering	—Unverified	0
Reasoning Chain Based Adversarial Attack for Multi-hop Question Answering	Dec 17, 2021	Adversarial AttackMulti-hop Question Answering	—Unverified	0
WebGPT: Browser-assisted question-answering with human feedback	Dec 17, 2021	Imitation LearningNavigate	CodeCode Available	1
Learning Rich Representation of Keyphrases from Text	Dec 16, 2021	Abstractive Text SummarizationKeyphrase Extraction	CodeCode Available	1
Models in the Loop: Aiding Crowdworkers with Generative Annotation Assistants	Dec 16, 2021	Extractive Question-AnsweringQuestion Answering	—Unverified	0
Explanation as Question Answering based on Design Knowledge	Dec 16, 2021	AI AgentOpen-Ended Question Answering	—Unverified	0
Evidentiality-guided Generation for Knowledge-Intensive NLP Tasks	Dec 16, 2021	AttributeFact Verification	CodeCode Available	1
Block-Skim: Efficient Question Answering for Transformer	Dec 16, 2021	Extractive Question-AnsweringQuestion Answering	CodeCode Available	0
Simple Questions Generate Named Entity Recognition Datasets	Dec 16, 2021	Few-shot NERNamed Entity Recognition	CodeCode Available	1
Ditch the Gold Standard: Re-evaluating Conversational Question Answering	Dec 16, 2021	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
QuALITY: Question Answering with Long Input Texts, Yes!	Dec 16, 2021	Multiple-choiceMultiple Choice Question Answering (MCQA)	CodeCode Available	1
Long Context Question Answering via Supervised Contrastive Learning	Dec 16, 2021	Contrastive LearningQuestion Answering	CodeCode Available	0
DREAM: Improving Situational QA by First Elaborating the Situation	Dec 16, 2021	Question Answering	CodeCode Available	1
Distilled Dual-Encoder Model for Vision-Language Understanding	Dec 16, 2021	Image to textmodel	CodeCode Available	1
Unsupervised Matching of Data and Text	Dec 16, 2021	Entity ResolutionQuestion Answering	CodeCode Available	0
Unsupervised Dense Information Retrieval with Contrastive Learning	Dec 16, 2021	Contrastive LearningCross-Lingual Transfer	CodeCode Available	1
QAFactEval: Improved QA-Based Factual Consistency Evaluation for Summarization	Dec 16, 2021	Question AnsweringQuestion Generation	CodeCode Available	1
CONQRR: Conversational Query Rewriting for Retrieval with Reinforcement Learning	Dec 16, 2021	Conversational Question AnsweringPassage Retrieval	—Unverified	0

Show:10 25 50

← PrevPage 240 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified