Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10501–10525 of 10817 papers

Title	Date	Tasks	Status
Bilaterally Slimmable Transformer for Elastic and Efficient Visual Question Answering	Mar 24, 2022	GPUQuestion Answering	CodeCode Available
Technical Question Answering across Tasks and Domains	Oct 19, 2020	Question AnsweringReading Comprehension	CodeCode Available
Scholarly Question Answering using Large Language Models in the NFDI4DataScience Gateway	Jun 11, 2024	Language ModelingLanguage Modelling	CodeCode Available
Towards Consistent Natural-Language Explanations via Explanation-Consistency Finetuning	Jan 25, 2024	Question Answering	CodeCode Available
World to Code: Multi-modal Data Generation via Self-Instructed Compositional Captioning and Filtering	Sep 30, 2024	Optical Character Recognition (OCR)Question Answering	CodeCode Available
TutorialVQA: Question Answering Dataset for Tutorial Videos	Dec 2, 2019	Question AnsweringVideo Question Answering	CodeCode Available
VerAs: Verify then Assess STEM Lab Reports	Feb 7, 2024	Automated Essay ScoringOpen-Domain Question Answering	CodeCode Available
Towards Automated Customer Support	Sep 2, 2018	Information RetrievalMachine Translation	CodeCode Available
TVQA+: Spatio-Temporal Grounding for Video Question Answering	Apr 25, 2019	Question AnsweringVideo Question Answering	CodeCode Available
Science Checker: Extractive-Boolean Question Answering For Scientific Fact Checking	Apr 26, 2022	ArticlesExtractive Question-Answering	CodeCode Available
Towards a Unified Multimodal Reasoning Framework	Dec 22, 2023	Multimodal ReasoningMultiple-choice	CodeCode Available
TweetNERD -- End to End Entity Linking Benchmark for Tweets	Oct 14, 2022	BenchmarkingEntity Linking	CodeCode Available
Verbs in Action: Improving verb understanding in video-language models	Apr 13, 2023	Contrastive LearningQuestion Answering	CodeCode Available
Team Trifecta at Factify5WQA: Setting the Standard in Fact Verification with Fine-Tuning	Mar 15, 2024	Fact VerificationIn-Context Learning	CodeCode Available
Teaching Smaller Language Models To Generalise To Unseen Compositional Questions	Aug 2, 2023	ARCInformation Retrieval	CodeCode Available
VQS: Linking Segmentations to Questions and Answers for Supervised Attention in VQA and Question-Focused Semantic Segmentation	Aug 15, 2017	Language ModelingLanguage Modelling	CodeCode Available
SILT: Efficient transformer training for inter-lingual inference	Mar 17, 2021	Cross-Lingual Natural Language InferenceNatural Language Inference	CodeCode Available
Towards a Search Engine for Machines: Unified Ranking for Multiple Retrieval-Augmented Large Language Models	Apr 30, 2024	Entity LinkingFact Verification	CodeCode Available
SMI: An Information-Theoretic Metric for Predicting Model Knowledge Solely from Pre-Training Signals	Feb 6, 2025	Question Answering	CodeCode Available
Scene Graph Prediction with Limited Labels	Apr 25, 2019	Knowledge Base CompletionPrediction	CodeCode Available
VF-Eval: Evaluating Multimodal LLMs for Generating Feedback on AIGC Videos	May 29, 2025	Question AnsweringVideo Generation	CodeCode Available
Teaching Probabilistic Logical Reasoning to Transformers	May 22, 2023	Logical ReasoningQuestion Answering	CodeCode Available
VGAT: A Cancer Survival Analysis Framework Transitioning from Generative Visual Question Answering to Genomic Reconstruction	Mar 25, 2025	Generative Visual Question AnsweringQuestion Answering	CodeCode Available
Towards a performance analysis on pre-trained Visual Question Answering models for autonomous driving	Jul 18, 2023	Autonomous DrivingModel Selection	CodeCode Available
VGA: Vision GUI Assistant -- Minimizing Hallucinations through Image-Centric Fine-Tuning	Jun 20, 2024	Image ComprehensionQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 421 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified