Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9201–9250 of 10817 papers

Title	Date	Tasks	Status
Cross-Pair Text Representations for Answer Sentence Selection	Oct 1, 2018	Natural Language InferenceOpen-Domain Question Answering	CodeCode Available
Is That Your Final Answer? Test-Time Scaling Improves Selective Question Answering	Feb 19, 2025	Question Answering	CodeCode Available
Is this Change the Answer to that Problem? Correlating Descriptions of Bug and Code Changes for Evaluating Patch Correctness	Aug 8, 2022	Question Answering	CodeCode Available
Cross-Modal Contrastive Learning for Robust Reasoning in VQA	Nov 21, 2022	Contrastive LearningQuestion Answering	CodeCode Available
BioRead: A New Dataset for Biomedical Reading Comprehension	May 1, 2018	Information RetrievalMachine Reading Comprehension	CodeCode Available
Hierarchical Transformer for Task Oriented Dialog Systems	Oct 24, 2020	Natural Language UnderstandingQuestion Answering	CodeCode Available
Accurate and Nuanced Open-QA Evaluation Through Textual Entailment	May 26, 2024	Natural Language InferenceOpen-Domain Question Answering	CodeCode Available
Hierarchical Memory Networks for Answer Selection on Unknown Words	Sep 28, 2016	Answer SelectionQuestion Answering	CodeCode Available
Q-NL Verifier: Leveraging Synthetic Data for Robust Knowledge Graph Question Answering	Mar 3, 2025	Graph Question AnsweringQuestion Answering	CodeCode Available
Iterative Alternating Neural Attention for Machine Reading	Jun 7, 2016	ArticlesQuestion Answering	CodeCode Available
BioRAGent: A Retrieval-Augmented Generation System for Showcasing Generative Query Expansion and Domain-Specific Search for Scientific Q&A	Dec 16, 2024	Answer GenerationFew-Shot Learning	CodeCode Available
Cross-Lingual Training for Automatic Question Generation	Jun 6, 2019	Natural Language UnderstandingQuestion Answering	CodeCode Available
Transformers in the Service of Description Logic-based Contexts	Nov 15, 2023	Question Answering	CodeCode Available
BioMedLAT Corpus: Annotation of the Lexical Answer Type for Biomedical Questions	Dec 1, 2016	Part-Of-Speech TaggingQuestion Answering	CodeCode Available
Hierarchical Graph Network for Multi-hop Question Answering	Nov 9, 2019	Multi-hop Question AnsweringQuestion Answering	CodeCode Available
An Evaluation Framework for Attributed Information Retrieval using Large Language Models	Sep 12, 2024	DiversityInformation Retrieval	CodeCode Available
A Lightweight Method to Generate Unanswerable Questions in English	Oct 30, 2023	Data AugmentationQuestion Answering	CodeCode Available
Modularized Zero-shot VQA with Pre-trained Models	May 27, 2023	object-detectionObject Detection	CodeCode Available
Cross-Lingual Text-Rich Visual Comprehension: An Information Theory Perspective	Dec 23, 2024	Question AnsweringVisual Question Answering	CodeCode Available
PaniniQA: Enhancing Patient Education Through Interactive Question Answering	Aug 7, 2023	Question Answering	CodeCode Available
Modulating early visual processing by language	Jul 2, 2017	Question AnsweringVisual Question Answering	CodeCode Available
Biomedical Named Entity Recognition at Scale	Nov 12, 2020	De-identificationEntity Resolution	CodeCode Available
Biomedical Knowledge Graph Embeddings with Negative Statements	Aug 7, 2023	Graph EmbeddingGraph Representation Learning	CodeCode Available
Cross-Lingual Question Answering over Knowledge Base as Reading Comprehension	Feb 26, 2023	Cross-Lingual Question AnsweringMachine Reading Comprehension	CodeCode Available
IUCM at SemEval-2018 Task 11: Similar-Topic Texts as a Comprehension Knowledge Source	Jun 1, 2018	ClusteringLemmatization	CodeCode Available
A Language for Function Signature Representations	Mar 31, 2018	Natural Language UnderstandingQuestion Answering	CodeCode Available
Cross-lingual Information Retrieval with BERT	Apr 24, 2020	Cross-Lingual Information RetrievalDocument Ranking	CodeCode Available
P NP, at least in Visual Question Answering	Mar 26, 2020	Question AnsweringVisual Question Answering	CodeCode Available
Jack the Reader -- A Machine Reading Framework	Jul 1, 2018	ArticlesInformation Retrieval	CodeCode Available
Hierarchical Deep Multi-modal Network for Medical Visual Question Answering	Sep 27, 2020	DescriptiveMedical Visual Question Answering	CodeCode Available
MoleculeQA: A Dataset to Evaluate Factual Accuracy in Molecular Comprehension	Mar 13, 2024	Question Answering	CodeCode Available
Biomedical Event Extraction as Multi-turn Question Answering	Nov 1, 2020	Event ExtractionKnowledge Base Population	CodeCode Available
Targeted Visual Prompting for Medical Visual Question Answering	Aug 6, 2024	Medical Visual Question AnsweringQuestion Answering	CodeCode Available
HICD: Hallucination-Inducing via Attention Dispersion for Contrastive Decoding to Mitigate Hallucinations in Large Language Models	Mar 17, 2025	HallucinationQuestion Answering	CodeCode Available
HeySQuAD: A Spoken Question Answering Dataset	Apr 26, 2023	Question Answering	CodeCode Available
TinyBERT: Distilling BERT for Natural Language Understanding	Sep 23, 2019	Knowledge DistillationLanguage Modelling	CodeCode Available
ACCEPT: Adaptive Codebook for Composite and Efficient Prompt Tuning	Oct 10, 2024	Natural Language Understandingparameter-efficient fine-tuning	CodeCode Available
Monitoring Decomposition Attacks in LLMs with Lightweight Sequential Monitors	Jun 12, 2025	Question AnsweringSafety Alignment	CodeCode Available
Cross-lingual Inference with A Chinese Entailment Graph	Mar 11, 2022	Entity TypingQuestion Answering	CodeCode Available
Biomedical Entity Linking as Multiple Choice Question Answering	Feb 23, 2024	Entity LinkingMultiple-choice	CodeCode Available
Monolingual or Multilingual Instruction Tuning: Which Makes a Better Alpaca	Sep 16, 2023	Instruction FollowingLarge Language Model	CodeCode Available
BioKGBench: A Knowledge Graph Checking Benchmark of AI Agent for Biomedical Science	Jun 29, 2024	AI AgentClaim Verification	CodeCode Available
HeteroQA: Learning towards Question-and-Answering through Multiple Information Sources via Heterogeneous Graph Modeling	Dec 27, 2021	ArticlesCommunity Question Answering	CodeCode Available
JMLR: Joint Medical LLM and Retrieval Training for Enhancing Reasoning and Professional Question Answering Capability	Feb 27, 2024	GPUInformation Retrieval	CodeCode Available
JNLP Team: Deep Learning for Legal Processing in COLIEE 2020	Nov 4, 2020	Deep LearningInformation Retrieval	CodeCode Available
Functorial Question Answering	May 17, 2019	Question AnsweringSentence	CodeCode Available
"John is 50 years old, can his son be 65?" Evaluating NLP Models' Understanding of Feasibility	Oct 14, 2022	Binary ClassificationQuestion Answering	CodeCode Available
Joint Answering and Explanation for Visual Commonsense Reasoning	Feb 25, 2022	Knowledge DistillationQuestion Answering	CodeCode Available
CROPE: Evaluating In-Context Adaptation of Vision and Language Models to Culture-Specific Concepts	Oct 20, 2024	Question AnsweringVisual Question Answering	CodeCode Available
CRiskEval: A Chinese Multi-Level Risk Evaluation Benchmark Dataset for Large Language Models	Jun 7, 2024	Multiple-choicePhilosophy	CodeCode Available

Show:10 25 50

← PrevPage 185 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified