Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10601–10650 of 10817 papers

Title	Date	Tasks	Status
Towards Creation of a Corpus for Argumentation Mining the Biomedical Genetics Research Literature	Jun 1, 2014	Abstract ArgumentationInformation Retrieval	—Unverified
Towards Data Distillation for End-to-end Spoken Conversational Question Answering	Oct 18, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data Poisoning Attack against Knowledge Graph Embedding	Apr 26, 2019	Data PoisoningGraph Embedding	—Unverified
Toward Deconfounding the Influence of Entity Demographics for Question Answering Accuracy	Apr 15, 2021	DiversityQuestion Answering	—Unverified
Towards Deep Learning in Hindi NER: An approach to tackle the Labelled Data Sparsity	Dec 1, 2016	Feature EngineeringMachine Translation	—Unverified
Towards Developing a Multilingual and Code-Mixed Visual Question Answering System by Knowledge Distillation	Sep 10, 2021	Knowledge DistillationQuestion Answering	—Unverified
Towards Developmentally Plausible Rewards: Communicative Success as a Learning Signal for Interactive Language Models	May 9, 2025	Language AcquisitionQuestion Answering	—Unverified
Towards Differential Relational Privacy and its use in Question Answering	Mar 30, 2022	MemorizationQuestion Answering	—Unverified
Towards Domain Adaptation from Limited Data for Question Answering Using Deep Neural Networks	Nov 6, 2019	Domain AdaptationQuestion Answering	—Unverified
Towards Efficient and Robust Moment Retrieval System: A Unified Framework for Multi-Granularity Models and Temporal Reranking	Apr 11, 2025	Moment RetrievalQuestion Answering	—Unverified
Towards Efficient Multi-LLM Inference: Characterization and Analysis of LLM Routing and Hierarchical Techniques	Jun 6, 2025	BenchmarkingModel Selection	—Unverified
Towards Escaping from Language Bias and OCR Error: Semantics-Centered Text Visual Question Answering	Mar 24, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Towards Faithful Response Generation for Chinese Table Question Answering	Nov 16, 2021	Question AnsweringResponse Generation	—Unverified
Towards Few-Shot Fact-Checking via Perplexity	Mar 17, 2021	Fact CheckingFew-Shot Learning	—Unverified
Towards Fine-Grained Video Question Answering	Mar 10, 2025	Language ModelingLanguage Modelling	—Unverified
Towards Generalist Biomedical AI	Jul 26, 2023	Medical Question AnsweringQuestion Answering	—Unverified
Towards Generalizable Methods for Automating Risk Score Calculation	May 1, 2022	Decision MakingQuestion Answering	—Unverified
Towards Generalizable Neuro-Symbolic Systems for Commonsense Question Answering	Oct 30, 2019	Common Sense ReasoningQuestion Answering	—Unverified
AudioChatLlama: Towards General-Purpose Speech Abilities for LLMs	Nov 12, 2023	Question Answering	—Unverified
Towards General Purpose Vision Systems: An End-to-End Task-Agnostic Vision-Language Architecture	Jan 1, 2022	Question AnsweringVisual Question Answering	—Unverified
Towards Graph-hop Retrieval and Reasoning in Complex Question Answering over Textual Database	May 23, 2023	DiversityQuestion Answering	—Unverified
Towards Graph Prompt Learning: A Survey and Beyond	Aug 26, 2024	Graph MiningPrompt Learning	—Unverified
Towards Grounded Visual Spatial Reasoning in Multi-Modal Vision Language Models	Aug 18, 2023	Image-text matchingObject Localization	—Unverified
Towards Harnessing Memory Networks for Coreference Resolution	Aug 1, 2017	coreference-resolutionCoreference Resolution	—Unverified
Towards Human-Level Understanding of Complex Process Engineering Schematics: A Pedagogical, Introspective Multi-Agent Framework for Open-Domain Question Answering	Aug 24, 2024	knowledge editingOpen-Domain Question Answering	—Unverified
Towards Identifying Hindi/Urdu Noun Templates in Support of a Large-Scale LFG Grammar	Aug 1, 2014	Question Answering	—Unverified
Towards Investigating Biases in Spoken Conversational Search	Sep 2, 2024	Conversational SearchQuestion Answering	—Unverified
Towards Knowledge Graphs Validation through Weighted Knowledge Sources	Apr 26, 2021	Knowledge GraphsQuestion Answering	—Unverified
Towards leveraging latent knowledge and Dialogue context for real-world conversational question answering	Dec 17, 2022	Conversational Question AnsweringQuestion Answering	—Unverified
Towards leveraging LLMs for Conditional QA	Dec 2, 2023	Extractive Question-AnsweringQuestion Answering	—Unverified
Towards Loosely-Coupling Knowledge Graph Embeddings and Ontology-based Reasoning	Feb 7, 2022	Graph EmbeddingKnowledge Graph Completion	—Unverified
Towards Mitigating Hallucination in Large Language Models via Self-Reflection	Oct 10, 2023	Answer GenerationHallucination	—Unverified
Towards Model Driven Architectures for Human Language Technologies	Aug 1, 2014	Code Generationmodel	—Unverified
Towards Models that Can See and Read	Jan 18, 2023	DecoderImage Captioning	—Unverified
Towards Monetary Incentives in Social Q&A Services	Mar 3, 2017	Question Answering	—Unverified
Towards Multilingual LLM Evaluation for Baltic and Nordic languages: A study on Lithuanian History	Jan 15, 2025	Multiple-choiceQuestion Answering	—Unverified
Towards Natural Language Question Answering over Earth Observation Linked Data using Attention-based Neural Machine Translation	Jan 23, 2021	Earth ObservationMachine Translation	—Unverified
Towards Omnidirectional Reasoning with 360-R1: A Dataset, Benchmark, and GRPO-based Method	May 20, 2025	HallucinationObject Localization	—Unverified
Towards Ontologically Grounded and Language-Agnostic Knowledge Graphs	Jul 20, 2023	Knowledge GraphsQuestion Answering	—Unverified
Towards Optimisation of Collaborative Question Answering over Knowledge Graphs	Aug 14, 2019	feature selectionKnowledge Graphs	—Unverified
Towards Optimizing the Costs of LLM Usage	Jan 29, 2024	Question AnsweringSentence	—Unverified
Towards Personalized Explanation of Robot Path Planning via User Feedback	Nov 1, 2020	Question AnsweringSpecificity	—Unverified
Pregnant Questions: The Importance of Pragmatic Awareness in Maternal Health Question Answering	Nov 16, 2023	Question Answering	—Unverified
Towards Probabilistic Question Answering Over Tabular Data	Jun 25, 2025	Natural Language QueriesQuestion Answering	—Unverified
Towards Query Logs for Privacy Studies: On Deriving Search Queries from Questions	Apr 4, 2020	Community Question AnsweringQuestion Answering	—Unverified
Towards Question Format Independent Numerical Reasoning: A Set of Prerequisite Tasks	May 18, 2020	Natural Language InferenceQuestion Answering	—Unverified
Towards Reasoning-Aware Explainable VQA	Nov 9, 2022	DecoderExplanation Generation	—Unverified
Towards Reliable Medical Question Answering: Techniques and Challenges in Mitigating Hallucinations in Language Models	Aug 25, 2024	Decision MakingHallucination	—Unverified
Towards Retrieval Augmented Generation over Large Video Libraries	Jun 21, 2024	Answer GenerationQuestion Answering	—Unverified
Towards Robust Evaluation: A Comprehensive Taxonomy of Datasets and Metrics for Open Domain Question Answering in the Era of Large Language Models	Jun 19, 2024	BenchmarkingOpen-Domain Question Answering	—Unverified

Show:10 25 50

← PrevPage 213 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified