Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1751–1760 of 10817 papers

Title	Date	Tasks	Status
Beyond Forecasting: Compositional Time Series Reasoning for End-to-End Task Execution	Oct 5, 2024	Anomaly DetectionDecision Making	—Unverified
Structured List-Grounded Question Answering	Oct 4, 2024	Question Answering	—Unverified
Question-Answering System for Bangla: Fine-tuning BERT-Bangla for a Closed Domain	Oct 4, 2024	Question Answering	—Unverified
Learning Semantic Structure through First-Order-Logic Translation	Oct 4, 2024	Question AnsweringTranslation	—Unverified
Cross-lingual Transfer for Automatic Question Generation by Learning Interrogative Structures in Target Languages	Oct 4, 2024	ChatbotCross-Lingual Transfer	—Unverified
Table Question Answering for Low-resourced Indic Languages	Oct 4, 2024	Cross-Lingual TransferMathematical Reasoning	CodeCode Available
ALR^2: A Retrieve-then-Reason Framework for Long-context Question Answering	Oct 4, 2024	Question AnsweringRetrieval	—Unverified
A General Framework for Producing Interpretable Semantic Text Embeddings	Oct 4, 2024	Question AnsweringQuestion Generation	CodeCode Available
Frame-Voyager: Learning to Query Frames for Video Large Language Models	Oct 4, 2024	Question AnsweringVideo Question Answering	—Unverified
EXAQ: Exponent Aware Quantization For LLMs Acceleration	Oct 4, 2024	QuantizationQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 176 of 1082Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified