Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7126–7150 of 10817 papers

Title	Date	Tasks	Status
Deep Bayesian Natural Language Processing	Jul 1, 2019	Caption GenerationClustering	—Unverified
Deep Bayesian Learning and Understanding	Aug 1, 2018	Document SummarizationMachine Translation	—Unverified
Advancing Multimodal Medical Capabilities of Gemini	May 6, 2024	Computed Tomography (CT)image-classification	—Unverified
KnowIT VQA: Answering Knowledge-Based Questions about Videos	Oct 23, 2019	Question AnsweringVideo Question Answering	—Unverified
Open-Domain Question Answering	Jul 1, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified
Deep Bayesian Active Learning for Multiple Correct Outputs	Dec 2, 2019	Active LearningAnswer Generation	—Unverified
Knowing Where to Look? Analysis on Attention of Visual Question Answering System	Oct 9, 2018	Question AnsweringVisual Question Answering	—Unverified
Generating and Evaluating Explanations of Attended and Error-Inducing Input Regions for VQA Models	Mar 26, 2021	Question AnsweringVisual Question Answering	—Unverified
Deep Attentive Sentence Ordering Network	Oct 1, 2018	Concept-To-Text GenerationDocument Summarization	—Unverified
AutoPrep: Natural Language Question-Aware Data Preparation with a Multi-Agent Framework	Dec 10, 2024	Code GenerationLarge Language Model	—Unverified
Deep Attention Neural Tensor Network for Visual Question Answering	Sep 1, 2018	Deep AttentionQuestion Answering	—Unverified
KnowGPT: Knowledge Graph based Prompting for Large Language Models	Dec 11, 2023	Knowledge GraphsPrompt Engineering	—Unverified
Know Better – A Clickbait Resolving Challenge	Jun 1, 2022	ArticlesClickbait Detection	—Unverified
Deep Algorithmic Question Answering: Towards a Compositionally Hybrid AI for Algorithmic Reasoning	Sep 16, 2021	image-classificationImage Classification	—Unverified
Auto-Parsing Network for Image Captioning and Visual Question Answering	Aug 24, 2021	Image CaptioningQuestion Answering	—Unverified
KNIFE: Distilling Reasoning Knowledge From Free-Text Rationales	Dec 19, 2022	Knowledge DistillationLanguage Modelling	—Unverified
Open-Domain Why-Question Answering with Adversarial Learning to Encode Answer Texts	Jul 1, 2019	Question AnsweringSentence	—Unverified
KLUE-CORE: A regression model of semantic textual similarity	Jun 1, 2013	LemmatizationQuestion Answering	—Unverified
Open-ended Commonsense Reasoning with Unrestricted Answer Scope	Oct 18, 2023	Question AnsweringRetrieval	—Unverified
Dedicated Workflow Management for OKBQA Framework	Dec 1, 2016	ManagementQuestion Answering	—Unverified
Kitten: a tool for normalizing HTML and extracting its textual content	May 1, 2012	Language ModellingQuestion Answering	—Unverified
KIT's Offline Speech Translation and Instruction Following Submission for IWSLT 2025	May 19, 2025	Automatic Speech RecognitionInstruction Following	—Unverified
Decoupled Transformer for Scalable Inference in Open-domain Question Answering	Sep 1, 2021	Knowledge DistillationMachine Reading Comprehension	—Unverified
Open-Ended Visual Question Answering by Multi-Modal Domain Adaptation	Nov 11, 2019	Domain AdaptationQuestion Answering	—Unverified
KIT-Multi: A Translation-Oriented Multilingual Embedding Corpus	May 1, 2018	Cross-Lingual Document ClassificationDocument Classification	—Unverified

Show:10 25 50

← PrevPage 286 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified