Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5601–5650 of 10817 papers

Title	Date	Tasks	Status	Hype
XLTime: A Cross-Lingual Knowledge Transfer Framework for Temporal Expression Extraction	May 3, 2022	Causal InferenceInformation Retrieval	CodeCode Available	0
Episodic Memory Question Answering	May 3, 2022	AI AgentQuestion Answering	—Unverified	0
DrugEHRQA: A Question Answering Dataset on Structured and Unstructured Electronic Health Records For Medicine Related Queries	May 3, 2022	Question AnsweringText to SQL	CodeCode Available	1
Paragraph-based Transformer Pre-training for Multi-Sentence Inference	May 2, 2022	Answer SelectionFact Verification	CodeCode Available	1
Answer-Me: Multi-Task Open-Vocabulary Visual Question Answering	May 2, 2022	DecoderImage Captioning	—Unverified	0
Ethics Sheets for AI Tasks	May 1, 2022	ArticlesEmotion Recognition	—Unverified	0
A Copy-Augmented Generative Model for Open-Domain Question Answering	May 1, 2022	Natural QuestionsOpen-Domain Question Answering	—Unverified	0
Systematic Inequalities in Language Technology Performance across the World’s Languages	May 1, 2022	Dependency ParsingMachine Translation	CodeCode Available	0
ViLMedic: a framework for research at the intersection of vision and language in medical AI	May 1, 2022	Medical Visual Question AnsweringQuestion Answering	—Unverified	0
MMCoQA: Conversational Question Answering over Text, Tables, and Images	May 1, 2022	BenchmarkingConversational Question Answering	CodeCode Available	0
Vision-Language Pretraining: Current Trends and the Future	May 1, 2022	Question AnsweringRepresentation Learning	—Unverified	0
Integrating Question Rewrites in Conversational Question Answering: A Reinforcement Learning Approach	May 1, 2022	Conversational Question AnsweringQuestion Answering	—Unverified	0
Unsupervised multiple-choice question generation for out-of-domain Q&A fine-tuning	May 1, 2022	Multiple-choiceQuestion Answering	—Unverified	0
HOSMEL: A Hot-Swappable Modularized Entity Linking Toolkit for Chinese	May 1, 2022	Entity LinkingQuestion Answering	CodeCode Available	1
Predicting Difficulty and Discrimination of Natural Language Questions	May 1, 2022	Active LearningQuestion Answering	—Unverified	0
Clustering Examples in Multi-Dataset Benchmarks with Item Response Theory	May 1, 2022	ClusteringNatural Language Inference	—Unverified	0
MTL-SLT: Multi-Task Learning for Spoken Language Tasks	May 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Fantastic Questions and Where to Find Them: FairytaleQA – An Authentic Dataset for Narrative Comprehension	May 1, 2022	BenchmarkingQuestion Answering	—Unverified	0
Towards Generalizable Methods for Automating Risk Score Calculation	May 1, 2022	Decision MakingQuestion Answering	—Unverified	0
A Knowledge storage and semantic space alignment Method for Multi-documents dialogue generation	May 1, 2022	ArticlesDialogue Generation	—Unverified	0
Explainable Assessment of Healthcare Articles with QA	May 1, 2022	ArticlesExplanation Generation	—Unverified	0
Video Language Co-Attention with Multimodal Fast-Learning Feature Fusion for VideoQA	May 1, 2022	Question AnsweringVideo Question Answering	—Unverified	0
Answer-level Calibration for Free-form Multiple Choice Question Answering	May 1, 2022	FormLanguage Modeling	CodeCode Available	0
Retrieval Data Augmentation Informed by Downstream Question Answering Performance	May 1, 2022	Data AugmentationQuestion Answering	—Unverified	0
ANNA”:" Enhanced Language Representation for Question Answering	May 1, 2022	Language ModelingLanguage Modelling	—Unverified	0
semiPQA: A Study on Product Question Answering over Semi-structured Data	May 1, 2022	AttributeQuestion Answering	—Unverified	0
Distilling Salient Reviews with Zero Labels	May 1, 2022	Question Answering	—Unverified	0
Learning to Imagine: Integrating Counterfactual Thinking in Neural Discrete Reasoning	May 1, 2022	counterfactualQuestion Answering	—Unverified	0
What Makes Good In-Context Examples for GPT-3?	May 1, 2022	In-Context LearningNatural Language Understanding	—Unverified	0
BEEDS: Large-Scale Biomedical Event Extraction using Distant Supervision and Question Answering	May 1, 2022	Event ExtractionKnowledge Base Population	CodeCode Available	0
DialDoc 2022 Shared Task: Open-Book Document-grounded Dialogue Modeling	May 1, 2022	Conversational Question AnsweringQuestion Answering	—Unverified	0
R3 : Refined Retriever-Reader pipeline for Multidoc2dial	May 1, 2022	Conversational Question AnsweringDecoder	—Unverified	0
KIQA: Knowledge-Infused Question Answering Model for Financial Table-Text Data	May 1, 2022	Entity LinkingEntity Retrieval	—Unverified	0
KaFSP: Knowledge-Aware Fuzzy Semantic Parsing for Conversational Question Answering over a Large-Scale Knowledge Base	May 1, 2022	Conversational Question AnsweringEntity Disambiguation	CodeCode Available	0
Data Quality Estimation Framework for Faster Tax Code Classification	May 1, 2022	AttributeAttribute Value Extraction	—Unverified	0
It is AI’s Turn to Ask Humans a Question: Question-Answer Pair Generation for Children’s Story Books	May 1, 2022	Answer GenerationQuestion-Answer-Generation	—Unverified	0
Investigating the Generative Approach for Question Answering in E-Commerce	May 1, 2022	Answer GenerationQuestion Answering	—Unverified	0
Overview of the MedVidQA 2022 Shared Task on Medical Video Question-Answering	May 1, 2022	Question AnsweringVideo Classification	—Unverified	0
Implicit Relation Linking for Question Answering over Knowledge Graph	May 1, 2022	Question AnsweringRelation	—Unverified	0
Identifying relevant common sense information in knowledge graphs	May 1, 2022	Common Sense ReasoningKnowledge Graphs	CodeCode Available	0
Pseudo Ambiguous and Clarifying Questions Based on Sentence Structures Toward Clarifying Question Answering System	May 1, 2022	Question AnsweringQuestion Generation	—Unverified	0
DuReader_vis: A Chinese Dataset for Open-domain Document Visual Question Answering	May 1, 2022	document understandingOpen-Domain Question Answering	—Unverified	0
ELQA: A Corpus of Metalinguistic Questions and Answers about English	May 1, 2022	Answer GenerationQuestion Answering	CodeCode Available	0
Clues Before Answers: Generation-Enhanced Multiple-Choice QA	Apr 30, 2022	DecoderMultiple-choice	CodeCode Available	1
Engineering flexible machine learning systems by traversing functionally-invariant paths	Apr 30, 2022	Adversarial RobustnessContinual Learning	CodeCode Available	1
Answer Consolidation: Formulation and Benchmarking	Apr 29, 2022	BenchmarkingQuestion Answering	CodeCode Available	0
Flamingo: a Visual Language Model for Few-Shot Learning	Apr 29, 2022	Few-Shot LearningGenerative Visual Question Answering	CodeCode Available	4
End-to-end Spoken Conversational Question Answering: Task, Dataset and Model	Apr 29, 2022	4kConversational Question Answering	—Unverified	0
Polyglot Prompt: Multilingual Multitask PrompTraining	Apr 29, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Inferring Implicit Relations in Complex Questions with Language Models	Apr 28, 2022	Implicit RelationsQuestion Answering	CodeCode Available	0

Show:10 25 50

← PrevPage 113 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified