Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5851–5875 of 10817 papers

Title	Date	Tasks	Status	Hype
Learning to Compose Diversified Prompts for Image Emotion Classification	Jan 26, 2022	ClassificationEmotion Classification	—Unverified	0
An Automated Question-Answering Framework Based on Evolution Algorithm	Jan 26, 2022	Question Answering	—Unverified	0
DOM-LM: Learning Generalizable Representations for HTML Documents	Jan 25, 2022	AttributeAttribute Extraction	CodeCode Available	1
SA-VQA: Structured Alignment of Visual and Semantic Representations for Visual Question Answering	Jan 25, 2022	Question AnsweringVisual Question Answering	—Unverified	0
MGA-VQA: Multi-Granularity Alignment for Visual Question Answering	Jan 25, 2022	Question AnsweringVisual Question Answering	—Unverified	0
Towards Collaborative Question Answering: A Preliminary Study	Jan 24, 2022	Question Answering	—Unverified	0
Artefact Retrieval: Overview of NLP Models with Knowledge Base Access	Jan 24, 2022	DiversityFact Checking	—Unverified	0
Table Pre-training: A Survey on Model Architectures, Pre-training Objectives, and Downstream Tasks	Jan 24, 2022	DenoisingQuestion Answering	CodeCode Available	1
Unified Question Generation with Continual Lifelong Learning	Jan 24, 2022	Lifelong learningQuestion Answering	—Unverified	0
Question Generation for Evaluating Cross-Dataset Shifts in Multi-modal Grounding	Jan 24, 2022	Question AnsweringQuestion Generation	—Unverified	0
Leaf: Multiple-Choice Question Generation	Jan 22, 2022	Multiple-choiceQuestion Answering	CodeCode Available	1
Question rewriting? Assessing its importance for conversational question answering	Jan 22, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	0
Conversational Information Seeking	Jan 21, 2022	Conversational Question AnsweringConversational Recommendation	—Unverified	0
GreaseLM: Graph REASoning Enhanced Language Models for Question Answering	Jan 21, 2022	Knowledge GraphsMedical Question Answering	CodeCode Available	2
Enhanced Knowledge Graphs Using Typed Entailment Graphs	Jan 20, 2022	Knowledge GraphsOpen Information Extraction	—Unverified	0
Knowledge Graph Question Answering Leaderboard: A Community Resource to Prevent a Replication Crisis	Jan 20, 2022	Graph Question AnsweringQuestion Answering	CodeCode Available	1
AstBERT: Enabling Language Model for Financial Code Understanding with Abstract Syntax Trees	Jan 20, 2022	Clone DetectionCode Search	—Unverified	0
Expert Finding in Legal Community Question Answering	Jan 19, 2022	Community Question AnsweringQuestion Answering	CodeCode Available	0
Evaluating Machine Common Sense via Cloze Testing	Jan 19, 2022	Common Sense ReasoningOpen-Ended Question Answering	—Unverified	0
Improving Biomedical Information Retrieval with Neural Retrievers	Jan 19, 2022	Biomedical Information RetrievalInformation Retrieval	—Unverified	0
Do KG-augmented Models Leverage Knowledge as Humans Do?	Jan 17, 2022	Knowledge GraphsQuestion Answering	—Unverified	0
Knowledge Graph Papers @ ICLR 2021	Jan 17, 2022	Complex Query AnsweringEntity Linking	—Unverified	0
Korean-Specific Dataset for Table Question Answering	Jan 17, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
RuMedBench: A Russian Medical Language Understanding Benchmark	Jan 17, 2022	Medical Diagnosisnamed-entity-recognition	CodeCode Available	1
Generalizable Neuro-symbolic Systems for Commonsense Question Answering	Jan 17, 2022	Knowledge GraphsQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 235 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified