Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3351–3400 of 10817 papers

Title	Date	Tasks	Status	Score
Joint Answering and Explanation for Visual Commonsense Reasoning	Feb 25, 2022	Knowledge DistillationQuestion Answering	CodeCode Available	5
QASports: A Question Answering Dataset about Sports	Sep 25, 2023	Decision MakingQuestion Answering	CodeCode Available	5
Joint Visual and Text Prompting for Improved Object-Centric Perception with Multimodal Large Language Models	Apr 6, 2024	MMEObject	CodeCode Available	5
JMLR: Joint Medical LLM and Retrieval Training for Enhancing Reasoning and Professional Question Answering Capability	Feb 27, 2024	GPUInformation Retrieval	CodeCode Available	5
JNLP Team: Deep Learning for Legal Processing in COLIEE 2020	Nov 4, 2020	Deep LearningInformation Retrieval	CodeCode Available	5
Enhancing the AI2 Diagrams Dataset Using Rhetorical Structure Theory	May 1, 2018	Question AnsweringVisual Question Answering (VQA)	CodeCode Available	5
CSS: Contrastive Semantic Similarity for Uncertainty Quantification of LLMs	Jun 5, 2024	ClusteringNatural Language Inference	CodeCode Available	5
Iterative Alternating Neural Attention for Machine Reading	Jun 7, 2016	ArticlesQuestion Answering	CodeCode Available	5
IUCM at SemEval-2018 Task 11: Similar-Topic Texts as a Comprehension Knowledge Source	Jun 1, 2018	ClusteringLemmatization	CodeCode Available	5
Auto-hMDS: Automatic Construction of a Large Heterogeneous Multilingual Multi-Document Summarization Corpus	May 1, 2018	Abstractive Text SummarizationDocument Summarization	CodeCode Available	5
Is That Your Final Answer? Test-Time Scaling Improves Selective Question Answering	Feb 19, 2025	Question Answering	CodeCode Available	5
ISQA: Informative Factuality Feedback for Scientific Summarization	Apr 20, 2024	Question Answering	CodeCode Available	5
Is this Change the Answer to that Problem? Correlating Descriptions of Bug and Code Changes for Evaluating Patch Correctness	Aug 8, 2022	Question Answering	CodeCode Available	5
Jack the Reader -- A Machine Reading Framework	Jul 1, 2018	ArticlesInformation Retrieval	CodeCode Available	5
JPAVE: A Generation and Classification-based Model for Joint Product Attribute Prediction and Value Extraction	Nov 7, 2023	AttributeAttribute Value Extraction	CodeCode Available	5
Quasar: Datasets for Question Answering by Search and Reading	Jul 12, 2017	Question AnsweringRetrieval	CodeCode Available	5
KEPR: Knowledge Enhancement and Plausibility Ranking for Generative Commonsense Question Answering	May 15, 2023	Passage RetrievalQuestion Answering	CodeCode Available	5
IQA: Interactive Query Construction in Semantic Question Answering Systems	Jun 20, 2020	Question Answering	CodeCode Available	5
IQ-VQA: Intelligent Visual Question Answering	Jul 8, 2020	Question AnsweringVisual Question Answering	CodeCode Available	5
Query-Focused Extractive Summarisation for Finding Ideal Answers to Biomedical and COVID-19 Questions	Aug 27, 2021	Question AnsweringSentence	CodeCode Available	5
Investigating the Shortcomings of LLMs in Step-by-Step Legal Reasoning	Feb 8, 2025	Legal ReasoningMultiple-choice	CodeCode Available	5
Query-Reduction Networks for Question Answering	Jun 14, 2016	Goal-Oriented DialogProcedural Text Understanding	CodeCode Available	5
Investigating Post-pretraining Representation Alignment for Cross-Lingual Question Answering	Sep 24, 2021	Cross-Lingual Question AnsweringQuestion Answering	CodeCode Available	5
Ensemble Transformer for Efficient and Accurate Ranking Tasks: an Application to Question Answering Systems	Jan 15, 2022	DiversityEfficient Neural Network	CodeCode Available	5
iParaphrasing: Extracting Visually Grounded Paraphrases via an Image	Jun 12, 2018	Image CaptioningQuestion Answering	CodeCode Available	5
iREL at SemEval-2024 Task 9: Improving Conventional Prompting Methods for Brain Teasers	May 25, 2024	Common Sense ReasoningMultiple-choice	CodeCode Available	5
Introducing MathQA -- A Math-Aware Question Answering System	Jun 28, 2019	MathQuestion Answering	CodeCode Available	5
IntKB: A Verifiable Interactive Framework for Knowledge Base Completion	Dec 1, 2020	Knowledge Base CompletionQuestion Answering	CodeCode Available	5
Intrinsic Subgraph Generation for Interpretable Graph based Visual Question Answering	Mar 26, 2024	Decision MakingExplainable artificial intelligence	CodeCode Available	5
Interpretable Proof Generation via Iterative Backward Reasoning	May 22, 2022	Question Answering	CodeCode Available	5
EntGPT: Linking Generative Large Language Models with Knowledge Bases	Feb 9, 2024	Entity DisambiguationEntity Linking	CodeCode Available	5
Question-Answering System Extracts Information on Injection Drug Use from Clinical Notes	May 15, 2023	Question Answering	CodeCode Available	5
Cross-Pair Text Representations for Answer Sentence Selection	Oct 1, 2018	Natural Language InferenceOpen-Domain Question Answering	CodeCode Available	5
AutoBench-V: Can Large Vision-Language Models Benchmark Themselves?	Oct 28, 2024	BenchmarkingQuestion Answering	CodeCode Available	5
InterroLang: Exploring NLP Models and Datasets through Dialogue-based Explanations	Oct 9, 2023	Dialogue Act ClassificationHate Speech Detection	CodeCode Available	5
IRGAN: A Minimax Game for Unifying Generative and Discriminative Information Retrieval Models	May 30, 2017	Ad-Hoc Information RetrievalDocument Ranking	CodeCode Available	5
Leveraging QA Datasets to Improve Generative Data Augmentation	May 25, 2022	Common Sense ReasoningData Augmentation	CodeCode Available	5
Question Condensing Networks for Answer Selection in Community Question Answering	Jul 1, 2018	Answer SelectionCommunity Question Answering	CodeCode Available	5
ADKGD: Anomaly Detection in Knowledge Graphs with Dual-Channel Training	Jan 13, 2025	Anomaly DetectionKnowledge Graphs	CodeCode Available	5
Cross-Modal Contrastive Learning for Robust Reasoning in VQA	Nov 21, 2022	Contrastive LearningQuestion Answering	CodeCode Available	5
A Unified Syntax-aware Framework for Semantic Role Labeling	Oct 1, 2018	Machine TranslationQuestion Answering	CodeCode Available	5
Interpretable Multi-hop Reasoning for Forecasting Future Links on Temporal Knowledge Graphs	Sep 29, 2021	Knowledge GraphsQuestion Answering	CodeCode Available	5
A Unified Hallucination Mitigation Framework for Large Vision-Language Models	Sep 24, 2024	HallucinationQuestion Answering	CodeCode Available	5
Interactive Machine Comprehension with Information Seeking Agents	Aug 27, 2019	Decision MakingInformation Retrieval	CodeCode Available	5
Question Similarity in Community Question Answering: A Systematic Exploration of Preprocessing Methods and Models	Sep 1, 2019	Community Question AnsweringQuestion Answering	CodeCode Available	5
Interactive Natural Language-based Person Search	Feb 19, 2020	Person SearchQuestion Answering	CodeCode Available	5
EpiK-Eval: Evaluation for Language Models as Epistemic Models	Oct 23, 2023	Question Answering	CodeCode Available	5
Episodic Memory in Lifelong Language Learning	Jun 3, 2019	Continual LearningGeneral Classification	CodeCode Available	5
A Claim Decomposition Benchmark for Long-form Answer Verification	Oct 16, 2024	FormHallucination	CodeCode Available	5
Interactive Instance-based Evaluation of Knowledge Base Question Answering	Nov 1, 2018	Entity LinkingKnowledge Base Question Answering	CodeCode Available	5

Show:10 25 50

← PrevPage 68 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified