Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10501–10550 of 10817 papers

Title	Date	Tasks	Status
Bilaterally Slimmable Transformer for Elastic and Efficient Visual Question Answering	Mar 24, 2022	GPUQuestion Answering	CodeCode Available
Technical Question Answering across Tasks and Domains	Oct 19, 2020	Question AnsweringReading Comprehension	CodeCode Available
Scholarly Question Answering using Large Language Models in the NFDI4DataScience Gateway	Jun 11, 2024	Language ModelingLanguage Modelling	CodeCode Available
Towards Consistent Natural-Language Explanations via Explanation-Consistency Finetuning	Jan 25, 2024	Question Answering	CodeCode Available
World to Code: Multi-modal Data Generation via Self-Instructed Compositional Captioning and Filtering	Sep 30, 2024	Optical Character Recognition (OCR)Question Answering	CodeCode Available
TutorialVQA: Question Answering Dataset for Tutorial Videos	Dec 2, 2019	Question AnsweringVideo Question Answering	CodeCode Available
VerAs: Verify then Assess STEM Lab Reports	Feb 7, 2024	Automated Essay ScoringOpen-Domain Question Answering	CodeCode Available
Towards Automated Customer Support	Sep 2, 2018	Information RetrievalMachine Translation	CodeCode Available
TVQA+: Spatio-Temporal Grounding for Video Question Answering	Apr 25, 2019	Question AnsweringVideo Question Answering	CodeCode Available
Science Checker: Extractive-Boolean Question Answering For Scientific Fact Checking	Apr 26, 2022	ArticlesExtractive Question-Answering	CodeCode Available
Towards a Unified Multimodal Reasoning Framework	Dec 22, 2023	Multimodal ReasoningMultiple-choice	CodeCode Available
TweetNERD -- End to End Entity Linking Benchmark for Tweets	Oct 14, 2022	BenchmarkingEntity Linking	CodeCode Available
Verbs in Action: Improving verb understanding in video-language models	Apr 13, 2023	Contrastive LearningQuestion Answering	CodeCode Available
Team Trifecta at Factify5WQA: Setting the Standard in Fact Verification with Fine-Tuning	Mar 15, 2024	Fact VerificationIn-Context Learning	CodeCode Available
Teaching Smaller Language Models To Generalise To Unseen Compositional Questions	Aug 2, 2023	ARCInformation Retrieval	CodeCode Available
VQS: Linking Segmentations to Questions and Answers for Supervised Attention in VQA and Question-Focused Semantic Segmentation	Aug 15, 2017	Language ModelingLanguage Modelling	CodeCode Available
SILT: Efficient transformer training for inter-lingual inference	Mar 17, 2021	Cross-Lingual Natural Language InferenceNatural Language Inference	CodeCode Available
Towards a Search Engine for Machines: Unified Ranking for Multiple Retrieval-Augmented Large Language Models	Apr 30, 2024	Entity LinkingFact Verification	CodeCode Available
SMI: An Information-Theoretic Metric for Predicting Model Knowledge Solely from Pre-Training Signals	Feb 6, 2025	Question Answering	CodeCode Available
Scene Graph Prediction with Limited Labels	Apr 25, 2019	Knowledge Base CompletionPrediction	CodeCode Available
VF-Eval: Evaluating Multimodal LLMs for Generating Feedback on AIGC Videos	May 29, 2025	Question AnsweringVideo Generation	CodeCode Available
Teaching Probabilistic Logical Reasoning to Transformers	May 22, 2023	Logical ReasoningQuestion Answering	CodeCode Available
VGAT: A Cancer Survival Analysis Framework Transitioning from Generative Visual Question Answering to Genomic Reconstruction	Mar 25, 2025	Generative Visual Question AnsweringQuestion Answering	CodeCode Available
Towards a performance analysis on pre-trained Visual Question Answering models for autonomous driving	Jul 18, 2023	Autonomous DrivingModel Selection	CodeCode Available
VGA: Vision GUI Assistant -- Minimizing Hallucinations through Image-Centric Fine-Tuning	Jun 20, 2024	Image ComprehensionQuestion Answering	CodeCode Available
SMASH at Qur’an QA 2022: Creating Better Faithful Data Splits for Low-resourced Question Answering Scenarios	Jun 1, 2022	Language ModelingLanguage Modelling	CodeCode Available
Typed-RAG: Type-aware Multi-Aspect Decomposition for Non-Factoid Question Answering	Mar 20, 2025	Question AnsweringRAG	CodeCode Available
VTQA: Visual Text Question Answering via Entity Alignment and Cross-Media Reasoning	Mar 5, 2023	Answer GenerationEntity Alignment	CodeCode Available
VIBIKNet: Visual Bidirectional Kernelized Network for Visual Question Answering	Dec 12, 2016	Question AnsweringVisual Question Answering	CodeCode Available
Which is the Effective Way for Gaokao: Information Retrieval or Neural Networks?	Apr 1, 2017	Information RetrievalMultiple-choice	CodeCode Available
Towards an AI-Driven Video-Based American Sign Language Dictionary: Exploring Design and Usage Experience with Learners	Apr 8, 2025	Question Answering	CodeCode Available
Towards Addressing the Misalignment of Object Proposal Evaluation for Vision-Language Tasks via Semantic Grounding	Sep 1, 2023	Graph GenerationImage Captioning	CodeCode Available
ViCLEVR: A Visual Reasoning Dataset and Hybrid Multimodal Fusion Model for Visual Question Answering in Vietnamese	Oct 27, 2023	Information RetrievalNatural Language Queries	CodeCode Available
ViConsFormer: Constituting Meaningful Phrases of Scene Texts using Transformer-based Method in Vietnamese Text-based Visual Question Answering	Oct 18, 2024	Question AnsweringVisual Question Answering	CodeCode Available
VidCtx: Context-aware Video Question Answering with Image Models	Dec 23, 2024	Large Language ModelQuestion Answering	CodeCode Available
TCC-Bench: Benchmarking the Traditional Chinese Culture Understanding Capabilities of MLLMs	May 16, 2025	BenchmarkingQuestion Answering	CodeCode Available
Towards Accurate and Reliable Energy Measurement of NLP Models	Oct 11, 2020	Question Answering	CodeCode Available
Towards a Benchmark for Causal Business Process Reasoning with LLMs	Jun 8, 2024	Question Answering	CodeCode Available
Taxonomy of Mathematical Plagiarism	Jan 30, 2024	MathQuestion Answering	CodeCode Available
Task Transfer and Domain Adaptation for Zero-Shot Question Answering	Jun 14, 2022	Domain AdaptationQuestion Answering	CodeCode Available
UFO: Unified Fact Obtaining for Commonsense Question Answering	May 25, 2023	Fact SelectionQuestion Answering	CodeCode Available
Task Formulation Matters When Learning Continually: A Case Study in Visual Question Answering	Sep 30, 2022	Continual LearningQuestion Answering	CodeCode Available
Semantic Categorization of Social Knowledge for Commonsense Question Answering	Sep 11, 2021	Question Answering	CodeCode Available
Task-Driven and Experience-Based Question Answering Corpus for In-Home Robot Application in the House3D Virtual Environment	Jun 1, 2022	General KnowledgeQuestion Answering	CodeCode Available
Task-Agnostic Attacks Against Vision Foundation Models	Mar 5, 2025	Depth EstimationQuestion Answering	CodeCode Available
TASA: Deceiving Question Answering Models by Twin Answer Sentences Attack	Oct 27, 2022	Adversarial AttackQuestion Answering	CodeCode Available
Target-Aware Spatio-Temporal Reasoning via Answering Questions in Dynamics Audio-Visual Scenarios	May 21, 2023	Audio-visual Question AnsweringAudio-Visual Question Answering (AVQA)	CodeCode Available
TAPE: Assessing Few-shot Russian Language Understanding	Oct 23, 2022	Adversarial AttackAdversarial Text	CodeCode Available
UIT-ViCoV19QA: A Dataset for COVID-19 Community-based Question Answering on Vietnamese Language	Sep 14, 2022	Question Answering	CodeCode Available
Semantically Equivalent Adversarial Rules for Debugging NLP models	Jul 1, 2018	Data AugmentationQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 211 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified