Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2741–2750 of 10817 papers

Title	Date	Tasks	Status
Can CLIP Count Stars? An Empirical Study on Quantity Bias in CLIP	Sep 23, 2024	Image GenerationQuestion Answering	—Unverified
Can Click Patterns across User's Query Logs Predict Answers to Definition Questions?	Apr 1, 2012	Question Answering	—Unverified
A Pipeline Japanese Entity Linking System with Embedding Features	Oct 1, 2016	Coreference ResolutionEntity Linking	—Unverified
A Hybrid Approach Towards Two Stage Bengali Question Classification Utilizing Smart Data Balancing Technique	Nov 30, 2019	ClassificationGeneral Classification	—Unverified
Can bidirectional encoder become the ultimate winner for downstream applications of foundation models?	Nov 27, 2024	Language ModelingLanguage Modelling	—Unverified
A Hybrid Approach to Features Representation for Fine-grained Arabic Named Entity Recognition	Aug 1, 2014	named-entity-recognitionNamed Entity Recognition	—Unverified
ActiveDPO: Active Direct Preference Optimization for Sample-Efficient Alignment	May 25, 2025	Code GenerationMathematical Reasoning	—Unverified
Active entailment encoding for explanation tree construction using parsimonious generation of hard negatives	Aug 2, 2022	Explanation GenerationQuestion Answering	—Unverified
API Is Enough: Conformal Prediction for Large Language Models Without Logit-Access	Mar 2, 2024	Conformal PredictionOpen-Ended Question Answering	—Unverified
A Picture May Be Worth a Hundred Words for Visual Question Answering	Jun 25, 2021	Data AugmentationDescriptive	—Unverified

Show:10 25 50

← PrevPage 275 of 1082Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified