Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7951–7975 of 10817 papers

Title	Date	Tasks	Status
Rank2Tell: A Multimodal Driving Dataset for Joint Importance Ranking and Reasoning	Sep 12, 2023	Autonomous VehiclesQuestion Answering	—Unverified
Font-Agent: Enhancing Font Understanding with Large Language Models	Jan 1, 2025	Font GenerationQuestion Answering	—Unverified
Good, Great, Excellent: Global Inference of Semantic Intensities	Jan 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Complex QA and language models hybrid architectures, Survey	Feb 17, 2023	Domain AdaptationFairness	—Unverified
Reasoning over Vision and Language: Exploring the Benefits of Supplemental Knowledge	Jan 15, 2021	Question AnsweringVisual Question Answering (VQA)	—Unverified
Ranking Automatically Generated Questions Using Common Human Queries	Sep 1, 2016	Question AnsweringText Generation	—Unverified
Good, Better, Best: Textual Distractors Generation for Multiple-Choice Visual Question Answering via Reinforcement Learning	Oct 21, 2019	Data AugmentationDecision Making	—Unverified
Ranking Facts for Explaining Answers to Elementary Science Questions	Oct 18, 2021	Interpretable Machine LearningLearning-To-Rank	—Unverified
FoQA: A Faroese Question-Answering Dataset	Feb 11, 2025	ArticlesExtractive Question-Answering	—Unverified
Ranking Kernels for Structures and Embeddings: A Hybrid Preference and Classification Model	Sep 1, 2017	Community Question AnsweringGeneral Classification	—Unverified
Ranking LLMs by compression	Jun 20, 2024	coreference-resolutionCoreference Resolution	—Unverified
FoRAG: Factuality-optimized Retrieval Augmented Generation for Web-enhanced Long-form Question Answering	Jun 19, 2024	Answer GenerationForm	—Unverified
Complex Program Induction for Querying Knowledge Bases in the Absence of Gold Programs	Mar 1, 2019	Natural Language QueriesProgram induction	—Unverified
RankRAG: Unifying Context Ranking with Retrieval-Augmented Generation in LLMs	Jul 2, 2024	Answer GenerationQuestion Answering	—Unverified
Rapid Adaptation of POS Tagging for Domain Specific Uses	Oct 31, 2014	Part-Of-Speech TaggingPOS	—Unverified
GOF at Qur’an QA 2022: Towards an Efficient Question Answering For The Holy Qu’ran In The Arabic Language Using Deep Learning-Based Approach	Jun 1, 2022	Question Answering	—Unverified
Assisting Scene Graph Generation with Self-Supervision	Aug 8, 2020	Graph GenerationImage Captioning	—Unverified
Assessment of Answers: Online Subjective Examination	Dec 1, 2012	Information RetrievalQuestion Answering	—Unverified
Rationale-Augmented Ensembles in Language Models	Jul 2, 2022	In-Context LearningPrompt Engineering	—Unverified
Forewords	Dec 1, 2017	Emotion RecognitionIntent Classification	—Unverified
Goal-Oriented Semantic Communication for Wireless Visual Question Answering	Nov 3, 2024	Edge-computingQuestion Answering	—Unverified
Complex Factoid Question Answering with a Free-Text Knowledge Graph	Mar 23, 2021	Graph Neural NetworkGraph Question Answering	—Unverified
Goal-Oriented Multi-Task BERT-Based Dialogue State Tracker	Feb 5, 2020	Dialogue State TrackingQuestion Answering	—Unverified
RAVEN: A Dataset for Relational and Analogical Visual rEasoNing	Mar 7, 2019	Object RecognitionQuestion Answering	—Unverified
Complete Chess Games Enable LLM Become A Chess Master	Jan 26, 2025	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 319 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified