Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3151–3200 of 10817 papers

Title	Date	Tasks	Status
Efficient Prompt Caching via Embedding Similarity	Feb 2, 2024	Question Answering	—Unverified
Efficient Prompting for LLM-based Generative Internet of Things	Jun 14, 2024	Prompt EngineeringQuestion Answering	—Unverified
EfficientQA : a RoBERTa Based Phrase-Indexed Question-Answering System	Jan 6, 2021	Extractive Question-AnsweringGPU	—Unverified
A Fully Coreference-annotated Corpus of Scholarly Papers from the ACL Anthology	Dec 1, 2012	Coreference ResolutionQuestion Answering	—Unverified
Explicit Reasoning over End-to-End Neural Architectures for Visual Question Answering	Mar 23, 2018	Question AnsweringVisual Question Answering	—Unverified
Dynamic-KGQA: A Scalable Framework for Generating Adaptive Question Answering Datasets	Mar 6, 2025	BenchmarkingDataset Generation	—Unverified
Efficient Search for Transformation-based Inference	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Efficient Tree-based Approximation for Entailment Graph Learning	Jul 1, 2012	Graph LearningNatural Language Inference	—Unverified
EffiQA: Efficient Question-Answering with Strategic Multi-Model Collaboration on Knowledge Graphs	Jun 3, 2024	Knowledge GraphsQuestion Answering	—Unverified
A novel knowledge graph development for industry design: A case study on indirect coal liquefaction process	Nov 27, 2021	Question Answering	—Unverified
Dynamic Integration of Background Knowledge in Neural NLU Systems	Jun 8, 2017	Common Sense ReasoningNatural Language Inference	—Unverified
Dynamic Graph Generation Network: Generating Relational Knowledge from Diagrams	Nov 27, 2017	Graph GenerationQuestion Answering	—Unverified
Explicit Diversity Conditions for Effective Question Answer Generation with Large Language Models	Jun 26, 2024	Answer GenerationData Augmentation	—Unverified
Dynamic Fusion With Intra- and Inter-Modality Attention Flow for Visual Question Answering	Jun 1, 2019	Question AnsweringVisual Question Answering	—Unverified
Dynamic Fusion with Intra- and Inter- Modality Attention Flow for Visual Question Answering	Dec 13, 2018	Question AnsweringVisual Question Answering	—Unverified
Answering List Questions using Web as a corpus	Apr 1, 2014	Information RetrievalQuestion Answering	—Unverified
Dynamic Few-Shot Learning for Knowledge Graph Question Answering	Jul 1, 2024	Few-Shot LearningGraph Question Answering	—Unverified
A novel interface for adversarial trivia question-writing	Mar 12, 2024	Question AnsweringSentence	—Unverified
A Context-aware Attention Network for Interactive Question Answering	Dec 22, 2016	DecoderQuestion Answering	—Unverified
EHRTutor: Enhancing Patient Understanding of Discharge Instructions	Oct 30, 2023	Conversational Question AnsweringLanguage Modeling	—Unverified
A Constituent Syntactic Parse Tree Based Discourse Parser	Aug 1, 2016	Question AnsweringText Classification	—Unverified
Explicit Knowledge-based Reasoning for Visual Question Answering	Nov 9, 2015	Question AnsweringVisual Question Answering	—Unverified
EICA Team at SemEval-2017 Task 3: Semantic and Metadata-based Features for Community Question Answering	Aug 1, 2017	Community Question AnsweringFeature Engineering	—Unverified
EIGEN: Event Influence GENeration using Pre-trained Language Models	Oct 22, 2020	Question Answering	—Unverified
A Novel Framework for Robustness Analysis of Visual QA Models	Nov 16, 2017	Question AnsweringVisual Question Answering	—Unverified
E-KAR: A Benchmark for Rationalizing Natural Language Analogical Reasoning	Mar 16, 2022	Explanation GenerationQuestion Answering	—Unverified
BQA: Body Language Question Answering Dataset for Video Large Language Models	Oct 17, 2024	Question Answering	—Unverified
Dynamic Adaptive Network Intelligence	Nov 19, 2015	Question AnsweringWeakly-supervised Learning	—Unverified
elBERto: Self-supervised Commonsense Learning for Question Answering	Mar 17, 2022	Question AnsweringRepresentation Learning	—Unverified
Brahmi-Net: A transliteration and script conversion system for languages of the Indian subcontinent	Jun 1, 2015	Information RetrievalMachine Translation	—Unverified
Explanation vs Attention: A Two-Player Game to Obtain Attention for VQA	Nov 19, 2019	Question AnsweringVisual Question Answering	—Unverified
A Novel Discriminative Framework for Sentence-Level Discourse Analysis	Jul 1, 2012	Question AnsweringSentence	—Unverified
BioAMA: Towards an End to End BioMedical Question Answering System	Jul 1, 2018	Natural Language InferenceNER	—Unverified
A Full End-to-End Semantic Role Labeler, Syntactic-agnostic Over Syntactic-aware?	Aug 1, 2018	DecoderMachine Translation	—Unverified
ElectroVizQA: How well do Multi-modal LLMs perform in Electronics Visual Question Answering?	Nov 27, 2024	Question AnsweringVisual Question Answering	—Unverified
Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM	Mar 12, 2024	Arithmetic ReasoningCode Generation	—Unverified
DUT-NLP at MEDIQA 2019: An Adversarial Multi-Task Network to Jointly Model Recognizing Question Entailment and Question Answering	Aug 1, 2019	Medical Question AnsweringMulti-Task Learning	—Unverified
DUTH at SemEval-2019 Task 8: Part-Of-Speech Features for Question Classification	Jun 1, 2019	Community Question AnsweringFact Checking	—Unverified
Eliminating Catastrophic Interference with Biased Competition	Jul 3, 2020	Question AnsweringVisual Question Answering	—Unverified
Binding Touch to Everything: Learning Unified Multimodal Tactile Representations	Jan 31, 2024	Question AnsweringVisual Question Answering (VQA)	—Unverified
Eliminating the Language Bias for Visual Question Answering with fine-grained Causal Intervention	Oct 14, 2024	Contrastive Learningcounterfactual	—Unverified
ELiRF-UPV at SemEval-2018 Task 11: Machine Comprehension using Commonsense Knowledge	Jun 1, 2018	Multiple-choiceQuestion Answering	—Unverified
ELIXR: Towards a general purpose X-ray artificial intelligence system through alignment of large language models and radiology vision encoders	Aug 2, 2023	Contrastive LearningQuestion Answering	—Unverified
Breaking Common Sense: WHOOPS! A Vision-and-Language Benchmark of Synthetic and Compositional Images	Mar 13, 2023	Common Sense ReasoningExplanation Generation	—Unverified
Explanations for CommonsenseQA: New Dataset and Models	Aug 1, 2021	Common Sense ReasoningExplanation Generation	—Unverified
Explicit Argument Identification for Discourse Parsing In Hindi: A Hybrid Pipeline	Jun 1, 2016	Discourse ParsingQuestion Answering	—Unverified
Embedded Semantic Lexicon Induction with Joint Global and Local Optimization	Aug 1, 2017	ClusteringQuestion Answering	—Unverified
Embedding-based Retrieval with LLM for Effective Agriculture Information Extracting from Unstructured Data	Aug 6, 2023	Language ModelingLanguage Modelling	—Unverified
DUT-BIM at MEDIQA 2019: Utilizing Transformer Network and Medical Domain-Specific Contextualized Representations for Question Answering	Aug 1, 2019	Question AnsweringRelation	—Unverified
Duplicate Question Retrieval and Confirmation Time Prediction in Software Communities	Sep 10, 2023	Community Question AnsweringDuplicate-Question Retrieval	—Unverified

Show:10 25 50

← PrevPage 64 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified