Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2376–2400 of 10817 papers

Title	Date	Tasks	Status
Classifying Inconsistencies in DBpedia Language Specific Chapters	May 1, 2014	Abstract ArgumentationQuestion Answering	—Unverified
Classifier Combination Approach for Question Classification for Bengali Question Answering System	Aug 31, 2020	ClassificationGeneral Classification	—Unverified
Artificial Intelligence (AI) in Action: Addressing the COVID-19 Pandemic with Natural Language Processing (NLP)	Oct 9, 2020	Emotion RecognitionInformation Retrieval	—Unverified
Aligning Opinions: Cross-Lingual Opinion Mining with Dependencies	Jul 1, 2015	Coreference ResolutionNamed Entity Recognition (NER)	—Unverified
Diversity and Consistency: Exploring Visual Question-Answer Pair Generation	Nov 1, 2021	DiversityQuestion Answering	—Unverified
DocChat: An Information Retrieval Approach for Chatbot Engines Using Unstructured Documents	Aug 1, 2016	ChatbotCommunity Question Answering	—Unverified
Classification of Attributes in a Natural Language Query into Different SQL Clauses	Sep 1, 2015	General ClassificationQuestion Answering	—Unverified
Classification Betters Regression in Query-based Multi-document Summarisation Techniques for Question Answering: Macquarie University at BioASQ7b	Sep 2, 2019	General ClassificationQuestion Answering	—Unverified
A Biomedical Question Answering System in BioASQ 2017	Aug 1, 2017	Question Answering	—Unverified
Clarify When Necessary: Resolving Ambiguity Through Interaction with LMs	Nov 16, 2023	Machine TranslationNatural Language Inference	—Unverified
Artefact Retrieval: Overview of NLP Models with Knowledge Base Access	Jan 24, 2022	DiversityFact Checking	—Unverified
Diversifying Joint Vision-Language Tokenization Learning	Jun 6, 2023	Question AnsweringRepresentation Learning	—Unverified
CLAM: Selective Clarification for Ambiguous Questions with Generative Language Models	Dec 15, 2022	Language ModellingQuestion Answering	—Unverified
Prompting Medical Large Vision-Language Models to Diagnose Pathologies by Visual Question Answering	Jul 31, 2024	DiagnosticHallucination	—Unverified
CLAMP: Contrastive LAnguage Model Prompt-tuning	Dec 4, 2023	Contrastive LearningImage Captioning	—Unverified
ClaiRE at SemEval-2018 Task 7: Classification of Relations using Embeddings	Jun 1, 2018	ClassificationGeneral Classification	—Unverified
Aligning MAGMA by Few-Shot Learning and Finetuning	Oct 18, 2022	Few-Shot LearningImage Captioning	—Unverified
Diverse Multi-Answer Retrieval with Determinantal Point Processes	Nov 29, 2022	Open-Domain Question AnsweringPoint Processes	—Unverified
Diversifying Knowledge Enhancement of Biomedical Language Models using Adapter Modules and Knowledge Graphs	Dec 21, 2023	Document ClassificationKnowledge Graphs	—Unverified
City-VLM: Towards Multidomain Perception Scene Understanding via Multimodal Incomplete Learning	Jul 17, 2025	Question AnsweringScene Understanding	—Unverified
ARS\_NITK at MEDIQA 2019:Analysing Various Methods for Natural Language Inference, Recognising Question Entailment and Medical Question Answering System	Aug 1, 2019	Information RetrievalMedical Question Answering	—Unverified
Aligning LLMs through Multi-perspective User Preference Ranking-based Feedback for Programming Question Answering	May 27, 2024	Community Question AnsweringIn-Context Learning	—Unverified
Citations and Trust in LLM Generated Responses	Jan 2, 2025	ChatbotQuestion Answering	—Unverified
Citation Analysis with Neural Attention Models	Nov 1, 2016	Information RetrievalQuestion Answering	—Unverified
Around the GLOBE: Numerical Aggregation Question-Answering on Heterogeneous Genealogical Knowledge Graphs with Deep Neural Networks	Jul 30, 2023	Dataset GenerationKnowledge Graphs	—Unverified

Show:10 25 50

← PrevPage 96 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified