Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6101–6125 of 10817 papers

Title	Date	Tasks	Status
Human-Adversarial Visual Question Answering	Jun 4, 2021	Question AnsweringVisual Question Answering	—Unverified
MC\^2: Multi-perspective Convolutional Cube for Conversational Machine Reading Comprehension	Jul 1, 2019	Conversational Question AnsweringMachine Reading Comprehension	—Unverified
Human Adversarial QA: Did the Model Understand the Paragraph?	Oct 16, 2020	Language ModelingLanguage Modelling	—Unverified
Huge Automatically Extracted Training-Sets for Multilingual Word SenseDisambiguation	May 1, 2018	Question AnsweringSemantic Parsing	—Unverified
Contrastive Data and Learning for Natural Language Processing	Jul 1, 2022	Contrastive LearningQuestion Answering	—Unverified
A survey on VQA_Datasets and Approaches	May 2, 2021	Question AnsweringSurvey	—Unverified
M-CNER: A Corpus for Chinese Named Entity Recognition in Multi-Domains	May 1, 2018	Chinese Named Entity Recognitionnamed-entity-recognition	—Unverified
MCQA: Multimodal Co-attention Based Network for Question Answering	Apr 25, 2020	cross-modal alignmentQuestion Answering	—Unverified
MCR-Net: A Multi-Step Co-Interactive Relation Network for Unanswerable Questions on Machine Reading Comprehension	Mar 8, 2021	Machine Reading ComprehensionQuestion Answering	—Unverified
MCSFF: Multi-modal Consistency and Specificity Fusion Framework for Entity Alignment	Oct 18, 2024	Entity AlignmentInformation Retrieval	—Unverified
MCTS-KBQA: Monte Carlo Tree Search for Knowledge Base Question Answering	Feb 19, 2025	Decision MakingKnowledge Base Question Answering	—Unverified
E3D-GPT: Enhanced 3D Visual Foundation for Medical Vision-Language Model	Oct 18, 2024	Language ModelingLanguage Modelling	—Unverified
Mining Fine-grained Opinion Expressions with Shallow Parsing	Sep 1, 2013	Fine-Grained Opinion AnalysisOpinion Mining	—Unverified
HRVQA: A Visual Question Answering Benchmark for High-Resolution Aerial Images	Jan 23, 2023	AttributeQuestion Answering	—Unverified
HRoT: Hybrid prompt strategy and Retrieval of Thought for Table-Text Hybrid Question Answering	Sep 22, 2023	In-Context LearningQuestion Answering	—Unverified
Contrastive Cross-Modal Knowledge Sharing Pre-training for Vision-Language Representation Learning and Retrieval	Jul 2, 2022	Contrastive LearningCross-Modal Retrieval	—Unverified
EACO: Enhancing Alignment in Multimodal LLMs via Critical Observation	Dec 6, 2024	MMEQuestion Answering	—Unverified
Meaningful Answer Generation of E-Commerce Question-Answering	Nov 14, 2020	Answer GenerationQuestion Answering	—Unverified
Mining Compatible/Incompatible Entities from Question and Answering via Yes/No Answer Classification using Distant Label Expansion	Dec 14, 2016	Community Question AnsweringGeneral Classification	—Unverified
HRCA+: Advanced Multiple-choice Machine Reading Comprehension Method	Jun 1, 2022	Machine Reading ComprehensionMultiple-choice	—Unverified
HPI Question Answering System in BioASQ 2016	Aug 1, 2016	Question Answering	—Unverified
Biomedical Question Answering: A Survey of Approaches and Challenges	Feb 10, 2021	Information RetrievalMachine Reading Comprehension	—Unverified
A Survey on Table Question Answering: Recent Advances	Jul 12, 2022	Question AnsweringSemantic Parsing	—Unverified
Measuring CLEVRness: Black-box Testing of Visual Reasoning Models	Sep 29, 2021	BenchmarkingDiagnostic	—Unverified
How You Ask Matters: The Effect of Paraphrastic Questions to BERT Performance on a Clinical SQuAD Dataset	Nov 1, 2020	Question AnsweringReading Comprehension	—Unverified

Show:10 25 50

← PrevPage 245 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified