Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9851–9900 of 10817 papers

Title	Date	Tasks	Status
Exploring Models and Data for Image Question Answering	May 8, 2015	Image Segmentationobject-detection	CodeCode Available
Length Optimization in Conformal Prediction	Jun 27, 2024	Conformal PredictionLanguage Modeling	CodeCode Available
Exploring Language Model Generalization in Low-Resource Extractive QA	Sep 27, 2024	Domain GeneralizationExtractive Question-Answering	CodeCode Available
Exploring Contrast Consistency of Open-Domain Question Answering Systems on Minimally Edited Questions	May 23, 2023	Data AugmentationLanguage Modeling	CodeCode Available
Exploring Contextualized Neural Language Models for Temporal Dependency Parsing	Apr 30, 2020	Dependency ParsingQuestion Answering	CodeCode Available
Neural Generative Question Answering	Dec 4, 2015	DecoderGenerative Question Answering	CodeCode Available
Exploiting Sentence-Level Representations for Passage Ranking	Jun 14, 2021	Open-Domain Question AnsweringPassage Ranking	CodeCode Available
Exploiting Reasoning Chains for Multi-hop Science Question Answering	Sep 7, 2021	Abstract Meaning RepresentationARC	CodeCode Available
Less is More: Rejecting Unreliable Reviews for Product Question Answering	Jul 9, 2020	Community Question AnsweringConformal Prediction	CodeCode Available
Explicit Graph Reasoning Fusing Knowledge and Contextual Information for Multi-hop Question Answering	Jul 1, 2022	Graph Neural NetworkMulti-hop Question Answering	CodeCode Available
AMUSE: Multilingual Semantic Parsing for Question Answering over Linked Data	Feb 26, 2018	FormKnowledge Base Question Answering	CodeCode Available
Safety Alignment in NLP Tasks: Weakly Aligned Summarization as an In-Context Attack	Dec 12, 2023	Question AnsweringSafety Alignment	CodeCode Available
CodeRepoQA: A Large-scale Benchmark for Software Engineering Question Answering	Dec 19, 2024	Question Answering	CodeCode Available
A Unified Hallucination Mitigation Framework for Large Vision-Language Models	Sep 24, 2024	HallucinationQuestion Answering	CodeCode Available
Expletives in Universal Dependency Treebanks	Nov 1, 2018	Coreference ResolutionQuestion Answering	CodeCode Available
Explanation Selection Using Unlabeled Data for Chain-of-Thought Prompting	Feb 9, 2023	Mathematical ReasoningNatural Language Inference	CodeCode Available
Neural models for Factual Inconsistency Classification with Explanations	Jun 15, 2023	8kClassification	CodeCode Available
A Deep Architecture for Semantic Matching with Multiple Positional Sentence Representations	Nov 26, 2015	Information RetrievalQuestion Answering	CodeCode Available
A Multi-Type Multi-Span Network for Reading Comprehension that Requires Discrete Reasoning	Aug 15, 2019	NegationQuestion Answering	CodeCode Available
Neural Modular Control for Embodied Question Answering	Oct 26, 2018	Embodied Question AnsweringImitation Learning	CodeCode Available
Towards Efficient Methods in Medical Question Answering using Knowledge Graph Embeddings	Jan 15, 2024	Knowledge Graph EmbeddingsKnowledge Graphs	CodeCode Available
Neural Multi-Step Reasoning for Question Answering on Semi-Structured Tables	Feb 21, 2017	Question Answering	CodeCode Available
Explainable Multi-hop Question Generation: An End-to-End Approach without Intermediate Question Labeling	Mar 31, 2024	Question AnsweringQuestion Generation	CodeCode Available
Question rewriting? Assessing its importance for conversational question answering	Jan 22, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available
Neural Natural Logic Inference for Interpretable Question Answering	Nov 1, 2021	Multiple-choiceNatural Language Inference	CodeCode Available
Expert Finding in Legal Community Question Answering	Jan 19, 2022	Community Question AnsweringQuestion Answering	CodeCode Available
Expeditious Generation of Knowledge Graph Embeddings	Mar 21, 2018	Graph EmbeddingKnowledge Graph Completion	CodeCode Available
Leveraging Large Language Models for Scalable Vector Graphics-Driven Image Understanding	Jun 9, 2023	Few-Shot Learningimage-classification	CodeCode Available
Leveraging Large Language Models in Code Question Answering: Baselines and Issues	Nov 5, 2024	Large Language ModelQuestion Answering	CodeCode Available
Preference-based Learning with Retrieval Augmented Generation for Conversational Question Answering	Mar 28, 2025	Conversational Question AnsweringQuestion Answering	CodeCode Available
Leveraging LLMs in Scholarly Knowledge Graph Question Answering	Nov 16, 2023	Graph Question AnsweringLanguage Modeling	CodeCode Available
Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, Natural Language Inference, and Question Answering	Jun 12, 2018	Natural Language InferenceParaphrase Identification	CodeCode Available
Reinforcement Replaces Supervision: Query focused Summarization using Deep Reinforcement Learning	Nov 29, 2023	Deep Reinforcement LearningLong Form Question Answering	CodeCode Available
A Quantum Many-body Wave Function Inspired Language Modeling Approach	Aug 28, 2018	Language ModelingLanguage Modelling	CodeCode Available
Leveraging Online Data to Enhance Medical Knowledge in a Small Persian Language Model	May 21, 2025	Language ModelingLanguage Modelling	CodeCode Available
Expanding the Vocabulary of BERT for Knowledge Base Construction	Oct 12, 2023	Knowledge Base ConstructionKnowledge Base Population	CodeCode Available
Augmenting Visual Question Answering with Semantic Frame Information in a Multitask Learning Approach	Jan 31, 2020	Question AnsweringVisual Question Answering	CodeCode Available
Question Similarity in Community Question Answering: A Systematic Exploration of Preprocessing Methods and Models	Sep 1, 2019	Community Question AnsweringQuestion Answering	CodeCode Available
CODAH: An Adversarially-Authored Question Answering Dataset for Common Sense	Jun 1, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available
Expanding End-to-End Question Answering on Differentiable Knowledge Graphs with Intersection	Sep 13, 2021	Knowledge GraphsQuestion Answering	CodeCode Available
Addressing Semantic Drift in Question Generation for Semi-Supervised Question Answering	Sep 13, 2019	ArticlesQuestion Answering	CodeCode Available
Leveraging Structured Information for Explainable Multi-hop Question Answering and Reasoning	Nov 7, 2023	Multi-hop Question AnsweringQuestion Answering	CodeCode Available
Re-Initialization Token Learning for Tool-Augmented Large Language Models	Jun 17, 2025	GSM8KQuestion Answering	CodeCode Available
Addressing Overprescribing Challenges: Fine-Tuning Large Language Models for Medication Recommendation Tasks	Mar 5, 2025	Medical Question Answeringparameter-efficient fine-tuning	CodeCode Available
Pre-trained Language Model for Biomedical Question Answering	Sep 18, 2019	Language ModelingLanguage Modelling	CodeCode Available
AQUALLM: Audio Question Answering Data Generation Using Large Language Models	Dec 28, 2023	Audio Question AnsweringQuestion Answering	CodeCode Available
Pretrained Transformers for Simple Question Answering over Knowledge Graphs	Jan 31, 2020	Knowledge GraphsQuestion Answering	CodeCode Available
Leveraging Topic Specificity and Social Relationships for Expert Finding in Community Question Answering Platforms	Jul 4, 2024	Community Question AnsweringLearning-To-Rank	CodeCode Available
QuIIL at T3 challenge: Towards Automation in Life-Saving Intervention Procedures from First-Person View	Jul 18, 2024	Action AnticipationAction Recognition	CodeCode Available
Neural Semantic Encoders	Jul 14, 2016	General ClassificationMachine Translation	CodeCode Available

Show:10 25 50

← PrevPage 198 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified