Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5976–6000 of 10817 papers

Title	Date	Tasks	Status
Low-Resource Clickbait Spoiling for Indonesian via Question Answering	Oct 12, 2023	Question Answering	—Unverified
A System for Building FrameNet-like Corpus for the Biomedical Domain	Apr 1, 2014	Question AnsweringSemantic Role Labeling	—Unverified
Low Resource Dependency Parsing: Cross-lingual Parameter Sharing in a Neural Network Parser	Jul 1, 2015	Dependency ParsingMachine Translation	—Unverified
HyperGLM: HyperGraph for Video Scene Graph Generation and Anticipation	Nov 27, 2024	Graph GenerationQuestion Answering	—Unverified
Low-Resource Semantic Role Labeling	Jun 1, 2014	Information RetrievalMachine Translation	—Unverified
Hyper-dimensional computing for a visual question-answering system that is trainable end-to-end	Nov 28, 2017	Question AnsweringVisual Question Answering	—Unverified
DSNDM: Deep Siamese Neural Discourse Model with Attention for Text Pairs Categorization and Ranking	Nov 1, 2020	Question Answering	—Unverified
LRRA:A Transparent Neural-Symbolic Reasoning Framework for Real-World Visual Question Answering	Aug 1, 2021	Question AnsweringVisual Question Answering	—Unverified
A Systematic Survey of Prompt Engineering in Large Language Models: Techniques and Applications	Feb 5, 2024	Prompt EngineeringQuestion Answering	—Unverified
Controlling Risk of Web Question Answering	May 24, 2019	Machine Reading ComprehensionQuestion Answering	—Unverified
Addressing Uncertainty in LLMs to Enhance Reliability in Generative AI	Nov 4, 2024	Conformal PredictionPrediction	—Unverified
MedVLM-R1: Incentivizing Medical Reasoning Capability of Vision-Language Models (VLMs) via Reinforcement Learning	Feb 26, 2025	Domain GeneralizationMedical Image Analysis	—Unverified
Can You Explain That? Lucid Explanations Help Human-AI Collaborative Image Retrieval	Apr 5, 2019	Image RetrievalQuestion Answering	—Unverified
MedXChat: A Unified Multimodal Large Language Model Framework towards CXRs Understanding and Generation	Dec 4, 2023	Instruction FollowingLanguage Modeling	—Unverified
MF2-MVQA: A Multi-stage Feature Fusion method for Medical Visual Question Answering	Nov 11, 2022	Medical Visual Question AnsweringQuestion Answering	—Unverified
Mitigating Knowledge Conflicts in Language Model-Driven Question Answering	Nov 18, 2024	Document SummarizationHallucination	—Unverified
Lumos : Empowering Multimodal LLMs with Scene Text Recognition	Feb 12, 2024	Language ModelingLanguage Modelling	—Unverified
Modality Alignment between Deep Representations for Effective Video-and-Language Learning	Jun 1, 2022	Question AnsweringVideo Captioning	—Unverified
A Novel Approach Towards Incorporating Context Processing Capabilities in NLIDB System	Oct 1, 2013	Question Answering	—Unverified
Hyperbolic Attention Networks	May 24, 2018	Machine TranslationQuestion Answering	—Unverified
HyPA-RAG: A Hybrid Parameter Adaptive Retrieval-Augmented Generation System for AI Legal and Policy Applications	Aug 29, 2024	Question AnsweringRAG	—Unverified
Controlled Natural Languages and Default Reasoning	May 11, 2019	ImplicaturesLogical Reasoning	—Unverified
Dual Capsule Attention Mask Network with Mutual Learning for Visual Question Answering	Oct 1, 2022	Question AnsweringVisual Question Answering	—Unverified
Hybrid-SQuAD: Hybrid Scholarly Question Answering Dataset	Dec 3, 2024	Knowledge GraphsLanguage Modeling	—Unverified
Hybrid Question Answering over Knowledge Base and Free Text	Dec 1, 2016	Information RetrievalQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 240 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified