Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4551–4575 of 10817 papers

Title	Date	Tasks	Status
Automatic Propbank Generation for Turkish	Sep 1, 2019	Information RetrievalMachine Translation	—Unverified
Automatic Prompt Selection for Large Language Models	Apr 3, 2024	GSM8KQuestion Answering	—Unverified
An Empirical Comparison of Question Classification Methods for Question Answering Systems	May 1, 2020	ClassificationGeneral Classification	—Unverified
Debating for Better Reasoning: An Unsupervised Multimodal Approach	May 20, 2025	Question AnsweringVisual Question Answering	—Unverified
Automatic Noun Compound Interpretation using Deep Neural Networks and Word Embeddings	Apr 1, 2015	Information RetrievalMachine Translation	—Unverified
Advancing Egocentric Video Question Answering with Multimodal Large Language Models	Apr 6, 2025	Object RecognitionQuestion Answering	—Unverified
Answering Any-hop Open-domain Questions with Iterative Document Reranking	Sep 16, 2020	Multi-hop Question AnsweringNatural Questions	—Unverified
Automatic lexical semantic classification of nouns	May 1, 2012	ClassificationEntity Typing	—Unverified
DDRprog: A CLEVR Differentiable Dynamic Reasoning Programmer	Mar 30, 2018	Question AnsweringVisual Question Answering	—Unverified
Automatic Keyword Extraction on Twitter	Jul 1, 2015	Information RetrievalKeyword Extraction	—Unverified
An Empirical Comparison of LM-based Question and Answer Generation Methods	May 26, 2023	Answer GenerationData Augmentation	—Unverified
A Comparative and Experimental Study on Automatic Question Answering Systems and its Robustness against Word Jumbling	Nov 27, 2023	Answer GenerationQuestion-Answer-Generation	—Unverified
Inside ASCENT: Exploring a Deep Commonsense Knowledge Base and its Usage in Question Answering	May 28, 2021	Commonsense Knowledge Base ConstructionQuestion Answering	—Unverified
Automatic Interpretation of the English Possessive	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
DC-BERT: Decoupling Question and Document for Efficient Contextual Encoding	Feb 28, 2020	Natural QuestionsOpen-Domain Question Answering	—Unverified
An Empirical Assessment of Contemporary Online Media in Ad-Hoc Corpus Creation for Social Events	Oct 1, 2013	Information RetrievalMachine Translation	—Unverified
DBpedia Domains: augmenting DBpedia with domain information	May 1, 2014	ClusteringOpen-Domain Question Answering	—Unverified
DBpedia: A Multilingual Cross-domain Knowledge Base	May 1, 2012	Entity LinkingQuestion Answering	—Unverified
Automatic Identifying Entity Type in Linked Data	Oct 1, 2016	Entity LinkingQuestion Answering	—Unverified
ReEval: Automatic Hallucination Evaluation for Retrieval-Augmented Large Language Models via Transferable Adversarial Attacks	Oct 19, 2023	HallucinationHallucination Evaluation	—Unverified
Davidsonian Scene Graph: Improving Reliability in Fine-grained Evaluation for Text-to-Image Generation	Oct 27, 2023	Image GenerationQuestion Answering	—Unverified
A Combined Pattern-based and Distributional Approach for Automatic Hypernym Detection in Dutch.	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Dataset vs Reality: Understanding Model Performance from the Perspective of Information Need	Dec 6, 2022	Image CaptioningInformation Retrieval	—Unverified
Datasets for Multilingual Answer Sentence Selection	Jun 14, 2024	Language ModelingLanguage Modelling	—Unverified
Inquire, Interact, and Integrate: A Proactive Agent Collaborative Framework for Zero-Shot Multimodal Medical Reasoning	May 19, 2024	Multimodal ReasoningQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 183 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified