Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8126–8150 of 10817 papers

Title	Date	Tasks	Status
Results of the fifth edition of the BioASQ Challenge	Aug 1, 2017	Information RetrievalQuestion Answering	—Unverified
Results of the seventh edition of the BioASQ Challenge	Jun 16, 2020	Question Answering	—Unverified
GigaPevt: Multimodal Medical Assistant	Feb 26, 2024	Question Answering	—Unverified
Reinforcement Learning for Optimizing RAG for Domain Chatbots	Jan 10, 2024	ChatbotQuestion Answering	—Unverified
Reinforcement learning for question answering in programming domain using public community scoring as a human feedback	Jan 19, 2024	Community Question AnsweringQuestion Answering	—Unverified
Comparative Analysis of CHATGPT and the evolution of language models	Mar 28, 2023	Machine TranslationQuestion Answering	—Unverified
Reinforcement Learning of Question-Answering Dialogue Policies for Virtual Museum Guides	Jul 1, 2012	Dialogue ManagementQuestion Answering	—Unverified
Reinforcement Learning of Two-Issue Negotiation Dialogue Policies	Aug 1, 2013	Question Answeringreinforcement-learning	—Unverified
Get Your Model Puzzled: Introducing Crossword-Solving as a New NLP Benchmark	Nov 16, 2021	Natural Language UnderstandingOpen-Domain Question Answering	—Unverified
Legal Question-Answering in the Indian Context: Efficacy, Challenges, and Potential of Modern AI Models	Sep 26, 2023	Natural Language QueriesQuestion Answering	—Unverified
Reinforcing Question Answering Agents with Minimalist Policy Gradient Optimization	May 20, 2025	HallucinationIn-Context Learning	—Unverified
From text to multimodal: a survey of adversarial example generation in question answering systems	Dec 26, 2023	Question AnsweringQuestion Generation	—Unverified
Reka Core, Flash, and Edge: A Series of Powerful Multimodal Language Models	Apr 18, 2024	GSM8KMMLU	—Unverified
Relational Graph Convolutional Neural Networks for Multihop Reasoning: A Comparative Study	Oct 12, 2022	Question Answering	—Unverified
Relational Graph Representation Learning for Open-Domain Question Answering	Oct 18, 2019	Graph Neural NetworkGraph Representation Learning	—Unverified
RPT: Relational Pre-trained Transformer Is Almost All You Need towards Democratizing Data Preparation	Dec 4, 2020	AllDecoder	—Unverified
Knowledge Graph Contrastive Learning Based on Relation-Symmetrical Structure	Nov 19, 2022	Contrastive LearningGraph Embedding	—Unverified
Assessing SRL Frameworks with Automatic Training Data Expansion	Apr 1, 2017	Question AnsweringSemantic Role Labeling	—Unverified
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified
Get Large Language Models Ready to Speak: A Late-fusion Approach for Speech Generation	Oct 27, 2024	parameter-efficient fine-tuningQuestion Answering	—Unverified
GermanQuAD and GermanDPR: Improving Non-English Question Answering and Passage Retrieval	Apr 26, 2021	Passage RetrievalQuestion Answering	—Unverified
Compact Tensor Pooling for Visual Question Answering	Jun 20, 2017	Question AnsweringVisual Question Answering	—Unverified
Relation/Entity-Centric Reading Comprehension	Aug 27, 2020	Question AnsweringReading Comprehension	—Unverified
Relation Classification as Two-way Span-Prediction	Oct 9, 2020	ClassificationGeneral Classification	—Unverified
German FinBERT: A German Pre-trained Language Model	Nov 15, 2023	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 326 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified