Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7351–7400 of 10817 papers

Title	Date	Tasks	Status
K-Edit: Language Model Editing with Contextual Knowledge Awareness	Feb 15, 2025	Knowledge GraphsLanguage Modeling	—Unverified
KECP: Knowledge Enhanced Contrastive Prompting for Few-shot Extractive Question Answering	May 6, 2022	Contrastive LearningExtractive Question-Answering	—Unverified
Automatic Propbank Generation for Turkish	Sep 1, 2019	Information RetrievalMachine Translation	—Unverified
KBQA: Learning Question Answering over QA Corpora and Knowledge Bases	Mar 6, 2019	Question Answering	—Unverified
Automatic Prompt Selection for Large Language Models	Apr 3, 2024	GSM8KQuestion Answering	—Unverified
Penalizing Confident Predictions on Largely Perturbed Inputs Does Not Improve Out-of-Distribution Generalization in Question Answering	Nov 29, 2022	Out-of-Distribution GeneralizationQuestion Answering	—Unverified
An Empirical Evaluation of Large Language Models on Consumer Health Questions	Dec 31, 2024	Medical Question AnsweringQuestion Answering	—Unverified
KBGen -- Text Generation from Knowledge Bases as a New Shared Task	May 1, 2012	Question AnsweringText Generation	—Unverified
KARPA: A Training-free Method of Adapting Knowledge Graph as References for Large Language Model's Reasoning Path Aggregation	Dec 30, 2024	Decision MakingGraph Question Answering	—Unverified
KARL: Knowledge-Aware Reasoning Memory Modeling with Reinforcement Learning of Vector Space	Dec 16, 2019	DecoderLanguage Modeling	—Unverified
Debating for Better Reasoning: An Unsupervised Multimodal Approach	May 20, 2025	Question AnsweringVisual Question Answering	—Unverified
KaPQA: Knowledge-Augmented Product Question-Answering	Jul 22, 2024	Question AnsweringRAG	—Unverified
KAnoCLIP: Zero-Shot Anomaly Detection through Knowledge-Driven Prompt Learning and Enhanced Cross-Modal Integration	Jan 7, 2025	Anomaly DetectionAnomaly Segmentation	—Unverified
Perception Test 2024: Challenge Summary and a Novel Hour-Long VideoQA Benchmark	Nov 29, 2024	BenchmarkingGrounded Video Question Answering	—Unverified
Automatic Noun Compound Interpretation using Deep Neural Networks and Word Embeddings	Apr 1, 2015	Information RetrievalMachine Translation	—Unverified
An Empirical Comparison of Question Classification Methods for Question Answering Systems	May 1, 2020	ClassificationGeneral Classification	—Unverified
KaLM: Knowledge-aligned Autoregressive Language Modeling via Dual-view Knowledge Graph Contrastive Learning	Dec 6, 2024	Contrastive LearningGraph Question Answering	—Unverified
Performance Analysis of Traditional VQA Models Under Limited Computational Resources	Feb 9, 2025	Question AnsweringVisual Question Answering	—Unverified
Knowledge Authoring and Question Answering with KALM	May 2, 2019	Question AnsweringWorld Knowledge	—Unverified
Performance Evaluation of Knowledge Graph Embedding Approaches under Non-adversarial Attacks	Jul 9, 2024	Graph EmbeddingKnowledge Graph Embedding	—Unverified
Answering Any-hop Open-domain Questions with Iterative Document Reranking	Sep 16, 2020	Multi-hop Question AnsweringNatural Questions	—Unverified
Automatic lexical semantic classification of nouns	May 1, 2012	ClassificationEntity Typing	—Unverified
KALA: Knowledge-Augmented Language Model Adaptation	Nov 16, 2021	Domain AdaptationGeneral Knowledge	—Unverified
Perhaps PTLMs Should Go to School – A Task to Assess Open Book and Closed Book QA	Oct 1, 2021	Question Answering	—Unverified
K-AID: Enhancing Pre-trained Language Models with Domain Knowledge for Question Answering	Sep 22, 2021	CPUKnowledge Distillation	—Unverified
PerkwE_COQA: Enhanced Persian Conversational Question Answering by combining contextual keyword extraction with Large Language Models	Apr 8, 2024	Conversational Question AnsweringKeyword Extraction	—Unverified
DDRprog: A CLEVR Differentiable Dynamic Reasoning Programmer	Mar 30, 2018	Question AnsweringVisual Question Answering	—Unverified
KaFT: Knowledge-aware Fine-tuning for Boosting LLMs' Domain-specific Question-Answering Performance	May 21, 2025	HallucinationQuestion Answering	—Unverified
PerLTQA: A Personal Long-Term Memory Dataset for Memory Classification, Retrieval, and Synthesis in Question Answering	Feb 26, 2024	Question AnsweringRetrieval	—Unverified
PerMedCQA: Benchmarking Large Language Models on Medical Consumer Question Answering in Persian Language	May 23, 2025	BenchmarkingQuestion Answering	—Unverified
Permutation Invariant Strategy Using Transformer Encoders for Table Understanding	Jul 1, 2022	Column Type AnnotationEntity Linking	—Unverified
PersianLLaMA: Towards Building First Persian Large Language Model	Dec 25, 2023	Language ModelingLanguage Modelling	—Unverified
Automatic Keyword Extraction on Twitter	Jul 1, 2015	Information RetrievalKeyword Extraction	—Unverified
Persian Semantic Role Labeling Using Transfer Learning and BERT-Based Models	Jun 17, 2023	Machine TranslationQuestion Answering	—Unverified
An Empirical Comparison of LM-based Question and Answer Generation Methods	May 26, 2023	Answer GenerationData Augmentation	—Unverified
Advancing Egocentric Video Question Answering with Multimodal Large Language Models	Apr 6, 2025	Object RecognitionQuestion Answering	—Unverified
A Comparative and Experimental Study on Automatic Question Answering Systems and its Robustness against Word Jumbling	Nov 27, 2023	Answer GenerationQuestion-Answer-Generation	—Unverified
`Just because you are right, doesn't mean I am wrong': Overcoming a bottleneck in development and evaluation of Open-Ended VQA tasks	Apr 1, 2021	Question AnsweringVisual Question Answering	—Unverified
Perspective Transition of Large Language Models for Solving Subjective Tasks	Jan 16, 2025	In-Context LearningQuestion Answering	—Unverified
Perturbation-based Active Learning for Question Answering	Nov 4, 2023	Active LearningDiversity	—Unverified
DC-BERT: Decoupling Question and Document for Efficient Contextual Encoding	Feb 28, 2020	Natural QuestionsOpen-Domain Question Answering	—Unverified
Automatic Interpretation of the English Possessive	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
PharmKE: Knowledge Extraction Platform for Pharmaceutical Texts using Transfer Learning	Feb 25, 2021	Articlesnamed-entity-recognition	—Unverified
Phase Conductor on Multi-layered Attentions for Machine Comprehension	Oct 28, 2017	Question AnsweringReading Comprehension	—Unverified
Philosophers are Mortal: Inferring the Truth of Unseen Facts	Aug 1, 2013	Common Sense ReasoningMachine Translation	—Unverified
PhotoshopQuiA: A Corpus of Non-Factoid Questions and Answers for Why-Question Answering	May 1, 2018	Answer SelectionCommunity Question Answering	—Unverified
Phrase2VecGLM: Neural generalized language model--based semantic tagging for complex query reformulation in medical IR	Jul 1, 2018	Document RankingInformation Retrieval	—Unverified
DBpedia Domains: augmenting DBpedia with domain information	May 1, 2014	ClusteringOpen-Domain Question Answering	—Unverified
JUST.ASK, a QA system that learns to answer new questions from previous interactions	May 1, 2014	Passage RetrievalQuestion Answering	—Unverified
DBpedia: A Multilingual Cross-domain Knowledge Base	May 1, 2012	Entity LinkingQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 148 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified