Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10526–10550 of 10817 papers

Title	Date	Tasks	Status
SMASH at Qur’an QA 2022: Creating Better Faithful Data Splits for Low-resourced Question Answering Scenarios	Jun 1, 2022	Language ModelingLanguage Modelling	CodeCode Available
Typed-RAG: Type-aware Multi-Aspect Decomposition for Non-Factoid Question Answering	Mar 20, 2025	Question AnsweringRAG	CodeCode Available
VTQA: Visual Text Question Answering via Entity Alignment and Cross-Media Reasoning	Mar 5, 2023	Answer GenerationEntity Alignment	CodeCode Available
VIBIKNet: Visual Bidirectional Kernelized Network for Visual Question Answering	Dec 12, 2016	Question AnsweringVisual Question Answering	CodeCode Available
Towards an AI-Driven Video-Based American Sign Language Dictionary: Exploring Design and Usage Experience with Learners	Apr 8, 2025	Question Answering	CodeCode Available
Which is the Effective Way for Gaokao: Information Retrieval or Neural Networks?	Apr 1, 2017	Information RetrievalMultiple-choice	CodeCode Available
Towards Addressing the Misalignment of Object Proposal Evaluation for Vision-Language Tasks via Semantic Grounding	Sep 1, 2023	Graph GenerationImage Captioning	CodeCode Available
ViCLEVR: A Visual Reasoning Dataset and Hybrid Multimodal Fusion Model for Visual Question Answering in Vietnamese	Oct 27, 2023	Information RetrievalNatural Language Queries	CodeCode Available
ViConsFormer: Constituting Meaningful Phrases of Scene Texts using Transformer-based Method in Vietnamese Text-based Visual Question Answering	Oct 18, 2024	Question AnsweringVisual Question Answering	CodeCode Available
VidCtx: Context-aware Video Question Answering with Image Models	Dec 23, 2024	Large Language ModelQuestion Answering	CodeCode Available
TCC-Bench: Benchmarking the Traditional Chinese Culture Understanding Capabilities of MLLMs	May 16, 2025	BenchmarkingQuestion Answering	CodeCode Available
Towards Accurate and Reliable Energy Measurement of NLP Models	Oct 11, 2020	Question Answering	CodeCode Available
Towards a Benchmark for Causal Business Process Reasoning with LLMs	Jun 8, 2024	Question Answering	CodeCode Available
Taxonomy of Mathematical Plagiarism	Jan 30, 2024	MathQuestion Answering	CodeCode Available
Task Transfer and Domain Adaptation for Zero-Shot Question Answering	Jun 14, 2022	Domain AdaptationQuestion Answering	CodeCode Available
UFO: Unified Fact Obtaining for Commonsense Question Answering	May 25, 2023	Fact SelectionQuestion Answering	CodeCode Available
Task Formulation Matters When Learning Continually: A Case Study in Visual Question Answering	Sep 30, 2022	Continual LearningQuestion Answering	CodeCode Available
Semantic Categorization of Social Knowledge for Commonsense Question Answering	Sep 11, 2021	Question Answering	CodeCode Available
Task-Driven and Experience-Based Question Answering Corpus for In-Home Robot Application in the House3D Virtual Environment	Jun 1, 2022	General KnowledgeQuestion Answering	CodeCode Available
Task-Agnostic Attacks Against Vision Foundation Models	Mar 5, 2025	Depth EstimationQuestion Answering	CodeCode Available
TASA: Deceiving Question Answering Models by Twin Answer Sentences Attack	Oct 27, 2022	Adversarial AttackQuestion Answering	CodeCode Available
Target-Aware Spatio-Temporal Reasoning via Answering Questions in Dynamics Audio-Visual Scenarios	May 21, 2023	Audio-visual Question AnsweringAudio-Visual Question Answering (AVQA)	CodeCode Available
TAPE: Assessing Few-shot Russian Language Understanding	Oct 23, 2022	Adversarial AttackAdversarial Text	CodeCode Available
UIT-ViCoV19QA: A Dataset for COVID-19 Community-based Question Answering on Vietnamese Language	Sep 14, 2022	Question Answering	CodeCode Available
Semantically Equivalent Adversarial Rules for Debugging NLP models	Jul 1, 2018	Data AugmentationQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 422 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified