Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3651–3660 of 10817 papers

Title	Date	Tasks	Status	Score
Analysing Mathematical Reasoning Abilities of Neural Models	Apr 2, 2019	Mathematical Question AnsweringMathematical Reasoning	CodeCode Available	5
Improving Differentiable Neural Computers Through Memory Masking, De-allocation, and Link Distribution Sharpness Control	Apr 23, 2019	Question Answering	CodeCode Available	5
Accurate and Regret-aware Numerical Problem Solver for Tabular Question Answering	Oct 10, 2024	Question AnsweringSemantic Parsing	CodeCode Available	5
Improving Complex Knowledge Base Question Answering via Question-to-Action and Question-to-Question Alignment	Dec 26, 2022	Knowledge Base Question AnsweringLanguage Modeling	CodeCode Available	5
Combining Lexical and Dense Retrieval for Computationally Efficient Multi-hop Question Answering	Jun 15, 2021	Multi-hop Question AnsweringOpen-Domain Question Answering	CodeCode Available	5
Improving Consistency in Large Language Models through Chain of Guidance	Feb 21, 2025	Question Answering	CodeCode Available	5
Chain-of-Action: Faithful and Multimodal Question Answering through Large Language Models	Mar 26, 2024	HallucinationInformation Retrieval	CodeCode Available	5
Improving Health Question Answering with Reliable and Time-Aware Evidence Retrieval	Apr 12, 2024	ArticlesQuestion Answering	CodeCode Available	5
Analogical Math Word Problems Solving with Enhanced Problem-Solution Association	Dec 1, 2022	MathQuestion Answering	CodeCode Available	5
Awakening Augmented Generation: Learning to Awaken Internal Knowledge of Large Language Models for Question Answering	Mar 22, 2024	Open-Domain Question AnsweringOut-of-Distribution Generalization	CodeCode Available	5

Show:10 25 50

← PrevPage 366 of 1082Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified