Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7601–7650 of 10817 papers

Title	Date	Tasks	Status
A strong baseline for question relevancy ranking	Aug 27, 2018	Community Question AnsweringFeature Engineering	—Unverified
Fast and Large-scale Unsupervised Relation Extraction	Oct 1, 2015	ClusteringDimensionality Reduction	—Unverified
Prompt-Aware Adapter: Towards Learning Adaptive Visual Tokens for Multimodal Large Language Models	May 24, 2024	Question AnsweringVisual Question Answering	—Unverified
Prompt-based Conservation Learning for Multi-hop Question Answering	Sep 14, 2022	Multi-hop Question AnsweringQuestion Answering	—Unverified
Prompt-based Learning for Unpaired Image Captioning	May 26, 2022	Image CaptioningImage-text Retrieval	—Unverified
Prompt-based Personalized Federated Learning for Medical Visual Question Answering	Feb 15, 2024	Federated LearningMedical Visual Question Answering	—Unverified
A Method to Generate a Machine-Labeled Data for Biomedical Named Entity Recognition with Various Sub-Domains	Nov 1, 2017	BIG-bench Machine Learningnamed-entity-recognition	—Unverified
GraspCorrect: Robotic Grasp Correction via Vision-Language Model-Guided Feedback	Mar 19, 2025	Language ModelingLanguage Modelling	—Unverified
Comprehension Based Question Answering using Bloom’s Taxonomy	Aug 1, 2021	Common Sense ReasoningQuestion Answering	—Unverified
Comprehension Based Question Answering using Bloom's Taxonomy	Jun 8, 2021	Common Sense ReasoningQuestion Answering	—Unverified
AstroLLaVA: towards the unification of astronomical data and natural language	Apr 11, 2025	AstronomyImage Captioning	—Unverified
Prompt Engineering for Healthcare: Methodologies and Applications	Apr 28, 2023	Machine TranslationPrompt Engineering	—Unverified
Prompt Generate Train (PGT): Few-shot Domain Adaption of Retrieval Augmented Generation Models for Open Book Question-Answering	Jul 12, 2023	Domain AdaptationGenerative Question Answering	—Unverified
Prompt Guided Copy Mechanism for Conversational Question Answering	Aug 7, 2023	Conversational Question AnsweringQuestion Answering	—Unverified
Graph-Structured Representations for Visual Question Answering	Sep 19, 2016	Multiple-choiceQuestion Answering	—Unverified
Graph Relation Transformer: Incorporating pairwise object features into the Transformer architecture	Nov 11, 2021	Graph AttentionQuestion Answering	—Unverified
Prompting Explicit and Implicit Knowledge for Multi-hop Question Answering Based on Human Reading Process	Feb 29, 2024	Multi-hop Question AnsweringQuestion Answering	—Unverified
Compound Type Identification in Sanskrit: What Roles do the Corpus and Grammar Play?	Dec 1, 2016	ClassificationGeneral Classification	—Unverified
Prompting Large Language Models with Knowledge Graphs for Question Answering Involving Long-tail Facts	May 10, 2024	Knowledge GraphsQuestion Answering	—Unverified
Prompting Large Language Models with Rationale Heuristics for Knowledge-based Visual Question Answering	Dec 22, 2024	Question AnsweringVisual Question Answering	—Unverified
Bilinear Graph Networks for Visual Question Answering	Jul 23, 2019	Question AnsweringVisual Question Answering	—Unverified
Prompting Large Language Models with Speech Recognition Abilities	Jul 21, 2023	Abstractive Text SummarizationAutomatic Speech Recognition	—Unverified
Prompting Video-Language Foundation Models with Domain-specific Fine-grained Heuristics for Video Question Answering	Oct 12, 2024	Question AnsweringVideo Question Answering	—Unverified
Prompting Whisper for QA-driven Zero-shot End-to-end Spoken Language Understanding	Jun 21, 2024	Cross-corpusDecoder	—Unverified
Graph Reasoning for Question Answering with Triplet Retrieval	May 30, 2023	Knowledge GraphsQuestion Answering	—Unverified
Prompt Perturbation Consistency Learning for Robust Language Models	Feb 24, 2024	Data Augmentationintent-classification	—Unverified
Compound Tokens: Channel Fusion for Vision-Language Representation Learning	Dec 2, 2022	DecoderLanguage Modeling	—Unverified
PromptRefine: Enhancing Few-Shot Performance on Low-Resource Indic Languages with Example Selection from Related Example Banks	Dec 7, 2024	Cross-Lingual Question AnsweringDiversity	—Unverified
Prompt Sketching for Large Language Models	Nov 8, 2023	Arithmetic ReasoningBenchmarking	—Unverified
FaVChat: Unlocking Fine-Grained Facail Video Understanding with Multimodal Large Language Models	Mar 12, 2025	Mixture-of-ExpertsQuestion Answering	—Unverified
AstroLLaMA-Chat: Scaling AstroLLaMA with Conversational and Diverse Datasets	Jan 3, 2024	AstronomyBenchmarking	—Unverified
A Methodology for Creating Question Answering Corpora Using Inverse Data Annotation	Apr 16, 2020	Question AnsweringSemantic Parsing	—Unverified
QLSC: A Query Latent Semantic Calibrator for Robust Extractive Question Answering	Apr 30, 2024	Extractive Question-AnsweringMachine Reading Comprehension	—Unverified
FBK-HLT: An Application of Semantic Textual Similarity for Answer Selection in Community Question Answering	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
Propbank-Br: a Brazilian Treebank annotated with semantic role labels	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Compounds and distributional thesauri	May 1, 2014	LemmatizationMachine Translation	—Unverified
Proposal-free One-stage Referring Expression via Grid-Word Cross-Attention	May 5, 2021	Question AnsweringReferring Expression	—Unverified
Proposing Plausible Answers for Open-ended Visual Question Answering	Oct 20, 2016	Graph MatchingOpen-Ended Question Answering	—Unverified
Proposition Knowledge Graphs	Aug 1, 2014	Knowledge GraphsNatural Language Inference	—Unverified
PropTest: Automatic Property Testing for Improved Visual Programming	Mar 25, 2024	Question AnsweringReferring Expression	—Unverified
ProQA: Structural Prompt-based Pre-training for Unified Question Answering	Jan 16, 2022	Continual LearningFew-Shot Learning	—Unverified
Graphologue: Exploring Large Language Model Responses with Interactive Diagrams	May 19, 2023	Language ModelingLanguage Modelling	—Unverified
ProSLM : A Prolog Synergized Language Model for explainable Domain Specific Knowledge Based Question Answering	Sep 17, 2024	Formal LogicLanguage Modeling	—Unverified
Feature Engineering in Learning-to-Rank for Community Question Answering Task	Sep 14, 2023	Community Question AnsweringFeature Engineering	—Unverified
ProSwitch: Knowledge-Guided Instruction Tuning to Switch Between Professional and Non-Professional Responses	Mar 14, 2024	Language ModelingLanguage Modelling	—Unverified
Feature extraction and evaluation for BioMedical Question Answering	May 28, 2021	Question AnsweringSentence	—Unverified
Graph Neural Networks in Vision-Language Image Understanding: A Survey	Mar 7, 2023	Image CaptioningImage Retrieval	—Unverified
ASTRID -- An Automated and Scalable TRIaD for the Evaluation of RAG-based Clinical Question Answering Systems	Jan 14, 2025	Question AnsweringRAG	—Unverified
Provenance: A Light-weight Fact-checker for Retrieval Augmented LLM Generation Output	Nov 1, 2024	Fact CheckingNatural Language Inference	—Unverified
Q-Heart: ECG Question Answering via Knowledge-Informed Multimodal LLMs	May 7, 2025	Electrocardiography (ECG)Language Modeling	—Unverified

Show:10 25 50

← PrevPage 153 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified