Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10651–10700 of 10817 papers

Title	Date	Tasks	Status
Towards Robust Numerical Question Answering: Diagnosing Numerical Capabilities of NLP Systems	Nov 14, 2022	Data AugmentationOpen-Ended Question Answering	—Unverified
Towards Semantic Search for Community Question Answering for Mortgage Officers	Mar 14, 2022	Community Question AnsweringDomain Adaptation	—Unverified
Towards Solving Multimodal Comprehension	Apr 20, 2021	16kAnswer Generation	—Unverified
Towards Spoken Mathematical Reasoning: Benchmarking Speech-based Models over Multi-faceted Math Problems	May 21, 2025	BenchmarkingMath	—Unverified
Towards Task-Agnostic Privacy- and Utility-Preserving Models	Sep 1, 2021	Question Answeringtext-classification	—Unverified
Towards Teachable Reasoning Systems: Using a Dynamic Memory of User Feedback for Continual System Improvement	Apr 27, 2022	Question Answering	—Unverified
Towards the Application of Calibrated Transformers to the Unsupervised Estimation of Question Difficulty from Text	Sep 1, 2021	Question Answering	—Unverified
Towards the automatic classification of complex-type nominals	Sep 1, 2013	ClassificationGeneral Classification	—Unverified
Towards the Exploitation of LLM-based Chatbot for Providing Legal Support to Palestinian Cooperatives	Jun 9, 2023	ChatbotQuestion Answering	—Unverified
Towards the Unsupervised Acquisition of Implicit Semantic Roles	Sep 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
Towards Time-Aware Knowledge Graph Completion	Dec 1, 2016	Knowledge Graph CompletionKnowledge Graphs	—Unverified
Towards Top-Down Reasoning: An Explainable Multi-Agent Approach for Visual Question Answering	Nov 29, 2023	Common Sense ReasoningQuestion Answering	—Unverified
Towards Topic-to-Question Generation	Mar 1, 2015	Information RetrievalQuestion Answering	—Unverified
Towards Transparent AI Systems: Interpreting Visual Question Answering Models	Aug 31, 2016	Question AnsweringVisual Question Answering	—Unverified
Towards Transparent Interactive Semantic Parsing via Step-by-Step Correction	Nov 16, 2021	Question AnsweringSemantic Parsing	—Unverified
Towards Truly Zero-shot Compositional Visual Reasoning with LLMs as Programmers	Jan 3, 2024	Question AnsweringVisual Grounding	—Unverified
Towards Two-step Multi-document Summarisation for Evidence Based Medicine: A Quantitative Analysis	Dec 1, 2012	Question Answering	—Unverified
Towards Understanding Camera Motions in Any Video	Apr 21, 2025	Question AnsweringText Retrieval	—Unverified
Towards Understanding Multi-Round Large Language Model Reasoning: Approximability, Learnability and Generalizability	Mar 5, 2025	Language ModelingLanguage Modelling	—Unverified
Towards Universal Dense Retrieval for Open-domain Question Answering	Sep 23, 2021	Open-Domain Question AnsweringQuestion Answering	—Unverified
Towards Unsupervised Learning of Temporal Relations between Events	Jan 23, 2014	Question AnsweringRelation	—Unverified
Towards Unsupervised Question Answering System with Multi-level Summarization for Legal Text	Mar 19, 2024	Binary ClassificationQuestion Answering	—Unverified
Towards Unsupervised Visual Reasoning: Do Off-The-Shelf Features Know How to Reason?	Dec 20, 2022	Question AnsweringRepresentation Learning	—Unverified
Towards Verifiable Text Generation with Symbolic References	Nov 15, 2023	Question AnsweringText Generation	—Unverified
Towards Visual Dialog for Radiology	Jul 1, 2020	Question AnsweringVisual Dialog	—Unverified
Towards Visual-Prompt Temporal Answering Grounding in Medical Instructional Video	Mar 13, 2022	Language ModellingQuestion Answering	—Unverified
Towards Visual Text Grounding of Multimodal Large Language Model	Apr 7, 2025	BenchmarkingLanguage Modeling	—Unverified
Towards Zero-Shot and Few-Shot Table Question Answering using GPT-3	Oct 31, 2022	Prompt EngineeringQuestion Answering	—Unverified
Toward the automatic extraction of knowledge of usable goods	Oct 1, 2016	Natural Language InferenceQuestion Answering	—Unverified
Toward Unsupervised Realistic Visual Question Answering	Mar 9, 2023	Question AnsweringVisual Question Answering	—Unverified
TPE: Towards Better Compositional Reasoning over Conceptual Tools with Multi-persona Collaboration	Sep 28, 2023	Question AnsweringResponse Generation	—Unverified
Tracking the Copyright of Large Vision-Language Models through Parameter Learning Adversarial Images	Feb 23, 2025	Adversarial AttackQuestion Answering	—Unverified
Tradeoffs in Sentence Selection Techniques for Open-Domain Question Answering	Sep 18, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified
Traffic-Domain Video Question Answering with Automatic Captioning	Jul 18, 2023	Question AnsweringVideo Question Answering	—Unverified
T-RAG: Lessons from the LLM Trenches	Feb 12, 2024	Question AnsweringRAG	—Unverified
Train Flat, Then Compress: Sharpness-Aware Minimization Learns More Compressible Models	May 25, 2022	Model CompressionQuantization	—Unverified
Training a Korean SRL System with Rich Morphological Features	Jun 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
Training a Ranking Function for Open-Domain Question Answering	Apr 12, 2018	Information RetrievalOpen-Domain Question Answering	—Unverified
Training Data is More Valuable than You Think: A Simple and Effective Method by Retrieving from Training Data	Nov 16, 2021	Language ModelingLanguage Modelling	—Unverified
Training Generative Question-Answering on Synthetic Data Obtained from an Instruct-tuned Model	Oct 12, 2023	Generative Question AnsweringQuestion Answering	—Unverified
Training IBM Watson using Automatically Generated Question-Answer Pairs	Nov 12, 2016	Answer GenerationQuestion-Answer-Generation	—Unverified
Training Question Answering Models From Synthetic Data	Feb 22, 2020	Answer GenerationData Augmentation	—Unverified
Training Recurrent Answering Units with Joint Loss Minimization for VQA	Jun 12, 2016	Question AnsweringVisual Question Answering	—Unverified
Training Table Question Answering via SQL Query Decomposition	Feb 19, 2024	Question AnsweringSemantic Parsing	—Unverified
TRANS-BLSTM: Transformer with Bidirectional LSTM for Language Understanding	Mar 16, 2020	Machine TranslationNatural Language Inference	—Unverified
Transcending Scaling Laws with 0.1% Extra Compute	Oct 20, 2022	Arithmetic ReasoningCross-Lingual Question Answering	—Unverified
TranscRater: a Tool for Automatic Speech Recognition Quality Estimation	Aug 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Transducing Sentences to Syntactic Feature Vectors: an Alternative Way to ``Parse''?	Aug 1, 2013	Graph SimilarityNatural Language Inference	—Unverified
Transferable Adversarial Attacks on Black-Box Vision-Language Models	May 2, 2025	Image CaptioningObject Recognition	—Unverified
Transferable speech-to-text large language model alignment module	Jun 19, 2024	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 214 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified