Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2351–2400 of 10817 papers

Title	Date	Tasks	Status
CLEVRER-Humans: Describing Physical and Causal Events the Human Way	Oct 5, 2023	Causal JudgmentData Augmentation	—Unverified
Align, Mask and Select: A Simple Method for Incorporating Commonsense Knowledge into Language Representation Models	Aug 19, 2019	Common Sense ReasoningNatural Language Inference	—Unverified
DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain Question Answering over Knowledge Base and Text	Oct 31, 2023	Information RetrievalKnowledge Graphs	—Unverified
DLIP: Distilling Language-Image Pre-training	Aug 24, 2023	Image CaptioningImage-text Retrieval	—Unverified
DLS@CU: Sentence Similarity from Word Alignment	Aug 1, 2014	Information RetrievalMachine Translation	—Unverified
A Search for Prompts: Generating Structured Answers from Contracts	Oct 16, 2023	Generative Question AnsweringIn-Context Learning	—Unverified
CLEAR: Contrastive Learning for Sentence Representation	Dec 31, 2020	Contrastive LearningLinguistic Acceptability	—Unverified
AsdKB: A Chinese Knowledge Base for the Early Screening and Diagnosis of Autism Spectrum Disorder	Jul 31, 2023	DiagnosticQuestion Answering	—Unverified
Adapting Pre-trained Generative Models for Extractive Question Answering	Nov 6, 2023	Extractive Question-AnsweringLong Form Question Answering	—Unverified
Diversity Enhances an LLM's Performance in RAG and Long-context Task	Feb 13, 2025	DiversityQuestion Answering	—Unverified
A scoping review on multimodal deep learning in biomedical images and texts	Jul 14, 2023	Cross-Modal RetrievalDecision Making	—Unverified
CL-CrossVQA: A Continual Learning Benchmark for Cross-Domain Visual Question Answering	Nov 19, 2022	Continual LearningQuestion Answering	—Unverified
Aligning Verb Senses in Two Italian Lexical Semantic Resources	Nov 1, 2013	Question AnsweringVocal Bursts Valence Prediction	—Unverified
Clause-based Discourse Segmentation of Arabic Texts	May 1, 2012	ArticlesDiscourse Segmentation	—Unverified
Claude 3.5 Sonnet Model Card Addendum	Jun 24, 2024	Code GenerationMMR total	—Unverified
ASBERT: Siamese and Triplet network embedding for open question answering	Apr 17, 2021	Answer SelectionNetwork Embedding	—Unverified
Adapting LLMs to Hebrew: Unveiling DictaLM 2.0 with Enhanced Vocabulary and Instruction Capabilities	Jul 9, 2024	Multilingual NLPQuestion Answering	—Unverified
Divide and Conquer: Text Semantic Matching with Disentangled Keywords and Intents	Jan 16, 2022	Community Question AnsweringInformation Retrieval	—Unverified
Class-Imbalanced-Aware Adaptive Dataset Distillation for Scalable Pretrained Model on Credit Scoring	Jan 18, 2025	Dataset DistillationQuestion Answering	—Unverified
Classifying Temporal Relations by Bidirectional LSTM over Dependency Paths	Jul 1, 2017	General ClassificationQuestion Answering	—Unverified
A Birds Eye View on Knowledge Graph Embeddings, Software Libraries, Applications and Challenges	May 18, 2022	Information RetrievalKnowledge Graph Completion	—Unverified
Classifying Relations via Long Short Term Memory Networks along Shortest Dependency Paths	Sep 1, 2015	Question AnsweringRelation Classification	—Unverified
Classifying Questions in Question Answering System Using Finite State Machines with a Simple Learning Approach	Nov 1, 2013	Question Answering	—Unverified
Aligning Text, Images, and 3D Structure Token-by-Token	Jun 9, 2025	3D Object RecognitionInstruction Following	—Unverified
Diversify-verify-adapt: Efficient and Robust Retrieval-Augmented Ambiguous Question Answering	Sep 4, 2024	Question AnsweringRAG	—Unverified
Classifying Inconsistencies in DBpedia Language Specific Chapters	May 1, 2014	Abstract ArgumentationQuestion Answering	—Unverified
Classifier Combination Approach for Question Classification for Bengali Question Answering System	Aug 31, 2020	ClassificationGeneral Classification	—Unverified
Artificial Intelligence (AI) in Action: Addressing the COVID-19 Pandemic with Natural Language Processing (NLP)	Oct 9, 2020	Emotion RecognitionInformation Retrieval	—Unverified
Aligning Opinions: Cross-Lingual Opinion Mining with Dependencies	Jul 1, 2015	Coreference ResolutionNamed Entity Recognition (NER)	—Unverified
Diversity and Consistency: Exploring Visual Question-Answer Pair Generation	Nov 1, 2021	DiversityQuestion Answering	—Unverified
DocChat: An Information Retrieval Approach for Chatbot Engines Using Unstructured Documents	Aug 1, 2016	ChatbotCommunity Question Answering	—Unverified
Classification of Attributes in a Natural Language Query into Different SQL Clauses	Sep 1, 2015	General ClassificationQuestion Answering	—Unverified
Classification Betters Regression in Query-based Multi-document Summarisation Techniques for Question Answering: Macquarie University at BioASQ7b	Sep 2, 2019	General ClassificationQuestion Answering	—Unverified
A Biomedical Question Answering System in BioASQ 2017	Aug 1, 2017	Question Answering	—Unverified
Clarify When Necessary: Resolving Ambiguity Through Interaction with LMs	Nov 16, 2023	Machine TranslationNatural Language Inference	—Unverified
Artefact Retrieval: Overview of NLP Models with Knowledge Base Access	Jan 24, 2022	DiversityFact Checking	—Unverified
Diversifying Joint Vision-Language Tokenization Learning	Jun 6, 2023	Question AnsweringRepresentation Learning	—Unverified
CLAM: Selective Clarification for Ambiguous Questions with Generative Language Models	Dec 15, 2022	Language ModellingQuestion Answering	—Unverified
Prompting Medical Large Vision-Language Models to Diagnose Pathologies by Visual Question Answering	Jul 31, 2024	DiagnosticHallucination	—Unverified
CLAMP: Contrastive LAnguage Model Prompt-tuning	Dec 4, 2023	Contrastive LearningImage Captioning	—Unverified
ClaiRE at SemEval-2018 Task 7: Classification of Relations using Embeddings	Jun 1, 2018	ClassificationGeneral Classification	—Unverified
Aligning MAGMA by Few-Shot Learning and Finetuning	Oct 18, 2022	Few-Shot LearningImage Captioning	—Unverified
Diverse Multi-Answer Retrieval with Determinantal Point Processes	Nov 29, 2022	Open-Domain Question AnsweringPoint Processes	—Unverified
Diversifying Knowledge Enhancement of Biomedical Language Models using Adapter Modules and Knowledge Graphs	Dec 21, 2023	Document ClassificationKnowledge Graphs	—Unverified
City-VLM: Towards Multidomain Perception Scene Understanding via Multimodal Incomplete Learning	Jul 17, 2025	Question AnsweringScene Understanding	—Unverified
ARS\_NITK at MEDIQA 2019:Analysing Various Methods for Natural Language Inference, Recognising Question Entailment and Medical Question Answering System	Aug 1, 2019	Information RetrievalMedical Question Answering	—Unverified
Aligning LLMs through Multi-perspective User Preference Ranking-based Feedback for Programming Question Answering	May 27, 2024	Community Question AnsweringIn-Context Learning	—Unverified
Citations and Trust in LLM Generated Responses	Jan 2, 2025	ChatbotQuestion Answering	—Unverified
Citation Analysis with Neural Attention Models	Nov 1, 2016	Information RetrievalQuestion Answering	—Unverified
Around the GLOBE: Numerical Aggregation Question-Answering on Heterogeneous Genealogical Knowledge Graphs with Deep Neural Networks	Jul 30, 2023	Dataset GenerationKnowledge Graphs	—Unverified

Show:10 25 50

← PrevPage 48 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified