Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5626–5650 of 10817 papers

Title	Date	Tasks	Status	Hype
semiPQA: A Study on Product Question Answering over Semi-structured Data	May 1, 2022	AttributeQuestion Answering	—Unverified	0
Distilling Salient Reviews with Zero Labels	May 1, 2022	Question Answering	—Unverified	0
Learning to Imagine: Integrating Counterfactual Thinking in Neural Discrete Reasoning	May 1, 2022	counterfactualQuestion Answering	—Unverified	0
What Makes Good In-Context Examples for GPT-3?	May 1, 2022	In-Context LearningNatural Language Understanding	—Unverified	0
BEEDS: Large-Scale Biomedical Event Extraction using Distant Supervision and Question Answering	May 1, 2022	Event ExtractionKnowledge Base Population	CodeCode Available	0
DialDoc 2022 Shared Task: Open-Book Document-grounded Dialogue Modeling	May 1, 2022	Conversational Question AnsweringQuestion Answering	—Unverified	0
R3 : Refined Retriever-Reader pipeline for Multidoc2dial	May 1, 2022	Conversational Question AnsweringDecoder	—Unverified	0
KIQA: Knowledge-Infused Question Answering Model for Financial Table-Text Data	May 1, 2022	Entity LinkingEntity Retrieval	—Unverified	0
KaFSP: Knowledge-Aware Fuzzy Semantic Parsing for Conversational Question Answering over a Large-Scale Knowledge Base	May 1, 2022	Conversational Question AnsweringEntity Disambiguation	CodeCode Available	0
Data Quality Estimation Framework for Faster Tax Code Classification	May 1, 2022	AttributeAttribute Value Extraction	—Unverified	0
It is AI’s Turn to Ask Humans a Question: Question-Answer Pair Generation for Children’s Story Books	May 1, 2022	Answer GenerationQuestion-Answer-Generation	—Unverified	0
Investigating the Generative Approach for Question Answering in E-Commerce	May 1, 2022	Answer GenerationQuestion Answering	—Unverified	0
Overview of the MedVidQA 2022 Shared Task on Medical Video Question-Answering	May 1, 2022	Question AnsweringVideo Classification	—Unverified	0
Implicit Relation Linking for Question Answering over Knowledge Graph	May 1, 2022	Question AnsweringRelation	—Unverified	0
Identifying relevant common sense information in knowledge graphs	May 1, 2022	Common Sense ReasoningKnowledge Graphs	CodeCode Available	0
Pseudo Ambiguous and Clarifying Questions Based on Sentence Structures Toward Clarifying Question Answering System	May 1, 2022	Question AnsweringQuestion Generation	—Unverified	0
DuReader_vis: A Chinese Dataset for Open-domain Document Visual Question Answering	May 1, 2022	document understandingOpen-Domain Question Answering	—Unverified	0
ELQA: A Corpus of Metalinguistic Questions and Answers about English	May 1, 2022	Answer GenerationQuestion Answering	CodeCode Available	0
Clues Before Answers: Generation-Enhanced Multiple-Choice QA	Apr 30, 2022	DecoderMultiple-choice	CodeCode Available	1
Engineering flexible machine learning systems by traversing functionally-invariant paths	Apr 30, 2022	Adversarial RobustnessContinual Learning	CodeCode Available	1
Answer Consolidation: Formulation and Benchmarking	Apr 29, 2022	BenchmarkingQuestion Answering	CodeCode Available	0
Flamingo: a Visual Language Model for Few-Shot Learning	Apr 29, 2022	Few-Shot LearningGenerative Visual Question Answering	CodeCode Available	4
End-to-end Spoken Conversational Question Answering: Task, Dataset and Model	Apr 29, 2022	4kConversational Question Answering	—Unverified	0
Polyglot Prompt: Multilingual Multitask PrompTraining	Apr 29, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Inferring Implicit Relations in Complex Questions with Language Models	Apr 28, 2022	Implicit RelationsQuestion Answering	CodeCode Available	0

Show:10 25 50

← PrevPage 226 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified