Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10501–10550 of 10817 papers

Title	Date	Tasks	Status
The Rotary Position Embedding May Cause Dimension Inefficiency in Attention Heads for Long-Distance Retrieval	Feb 16, 2025	PositionQuestion Answering	—Unverified
The Silent Saboteur: Imperceptible Adversarial Attacks against Black-Box Retrieval-Augmented Generation Systems	May 24, 2025	Answer GenerationQuestion Answering	—Unverified
The Solution for the ICCV 2023 Perception Test Challenge 2023 -- Task 6 -- Grounded videoQA	Jul 2, 2024	Grounded Video Question AnsweringObject Tracking	—Unverified
The State-of-the-Art in Lifelog Retrieval: A Review of Progress at the ACM Lifelog Search Challenge Workshop 2022-24	Jun 7, 2025	Question AnsweringRetrieval	—Unverified
The TARSQI Toolkit	May 1, 2012	Question Answering	—Unverified
The Turing Deception	Dec 9, 2022	Question AnsweringText Generation	—Unverified
The UIR Uncertainty Corpus for Chinese: Annotating Chinese Microblog Corpus for Uncertainty Identification from Social Media	May 1, 2018	Question Answering	—Unverified
The University of Texas at Dallas HLTRI's Participation in EPIC-QA: Searching for Entailed Questions Revealing Novel Answer Nuggets	Dec 28, 2021	Information RetrievalQuestion Answering	—Unverified
The Use of Dependency Relation Graph to Enhance the Term Weighting in Question Retrieval	Dec 1, 2012	Information RetrievalQuestion Answering	—Unverified
The Value of Semantic Parse Labeling for Knowledge Base Question Answering	Aug 1, 2016	Knowledge Base Question AnsweringQuestion Answering	—Unverified
The Visual QA Devil in the Details: The Impact of Early Fusion and Batch Norm on CLEVR	Sep 11, 2018	Question AnsweringRelational Reasoning	—Unverified
The VQA-Machine: Learning How to Use Existing Vision Algorithms to Answer New Questions	Dec 16, 2016	BIG-bench Machine LearningQuestion Answering	—Unverified
The WDAqua ITN: Answering Questions using Web Data	Jun 10, 2015	Question Answering	—Unverified
The Web as an Implicit Training Set: Application to Noun Compounds Syntax and Semantics	Jul 1, 2015	Community Question AnsweringMachine Translation	—Unverified
The Wisdom of MaSSeS: Majority, Subjectivity, and Semantic Similarity in the Evaluation of VQA	Sep 12, 2018	Question AnsweringSemantic Similarity	—Unverified
Think before you speak: Training Language Models With Pause Tokens	Oct 3, 2023	DecoderGSM8K	—Unverified
Think you have Solved Direct-Answer Question Answering? Try ARC-DA, the Direct-Answer AI2 Reasoning Challenge	Feb 5, 2021	AI2 Reasoning ChallengeARC	—Unverified
This is how we do it: Answer Reranking for Open-domain How Questions with Paragraph Vectors and Minimal Feature Engineering	Jun 1, 2016	Feature EngineeringQuestion Answering	—Unverified
Thought Flow Nets: From Single Predictions to Trains of Model Thought	Jul 26, 2021	Question Answering	—Unverified
Thread: A Logic-Based Data Organization Paradigm for How-To Question Answering with Retrieval Augmented Generation	Jun 19, 2024	Decision MakingQuestion Answering	—Unverified
Thread-Level Information for Comment Classification in Community Question Answering	Jul 1, 2015	Answer SelectionClassification	—Unverified
Thread Specific Features are Helpful for Identifying Subjectivity Orientation of Online Forum Threads	Dec 1, 2012	Document SummarizationMulti-Document Summarization	—Unverified
Threshold-Based Retrieval and Textual Entailment Detection on Legal Bar Exam Questions	May 30, 2019	Natural Language InferenceQuestion Answering	—Unverified
Tiantianzhu7:System Description of Semantic Textual Similarity (STS) in the SemEval-2012 (Task 6)	Jul 1, 2012	Machine TranslationQuestion Answering	—Unverified
Tianyi: A Traditional Chinese Medicine all-rounder language model and its Real-World Clinical Practice	May 19, 2025	AllHallucination	—Unverified
TIGQA:An Expert Annotated Question Answering Dataset in Tigrinya	Apr 26, 2024	Machine TranslationQuestion Answering	—Unverified
TI-JEPA: An Innovative Energy-based Joint Embedding Strategy for Text-Image Multimodal Systems	Mar 9, 2025	Multimodal Sentiment AnalysisQuestion Answering	—Unverified
Time-aware Multiway Adaptive Fusion Network for Temporal Knowledge Graph Question Answering	Feb 24, 2023	Graph Question AnsweringKnowledge Graphs	—Unverified
TimeLogic: A Temporal Logic Benchmark for Video QA	Jan 13, 2025	2kAction Segmentation	—Unverified
Time-MQA: Time Series Multi-Task Question Answering with Context Enhancement	Feb 26, 2025	Anomaly DetectionNatural Language Queries	—Unverified
TIME: Temporal-sensitive Multi-dimensional Instruction Tuning and Benchmarking for Video-LLMs	Mar 13, 2025	BenchmarkingQuestion Answering	—Unverified
TINA: Think, Interaction, and Action Framework for Zero-Shot Vision Language Navigation	Mar 13, 2024	Question AnsweringVision-Language Navigation	—Unverified
TinyDrive: Multiscale Visual Question Answering with Selective Token Routing for Autonomous Driving	May 21, 2025	Autonomous DrivingQuestion Answering	—Unverified
TinyRS-R1: Compact Multimodal Language Model for Remote Sensing	May 17, 2025	Language ModelingLanguage Modelling	—Unverified
TinyVQA: Compact Multimodal Deep Neural Network for Visual Question Answering on Resource-Constrained Devices	Apr 4, 2024	QuantizationQuestion Answering	—Unverified
Tip of the Tongue Known-Item Retrieval: A Case Study in Movie Identification	Jan 18, 2021	Community Question AnsweringInformation Retrieval	—Unverified
'Tis but Thy Name: Semantic Question Answering Evaluation with 11M Names for 1M Entities	Feb 28, 2022	Question AnsweringSemantic Similarity	—Unverified
T-Know: a Knowledge Graph-based Question Answering and Infor-mation Retrieval System for Traditional Chinese Medicine	Aug 1, 2018	Information RetrievalQuestion Answering	—Unverified
TM-PATHVQA:90000+ Textless Multilingual Questions for Medical Visual Question Answering	Jul 16, 2024	Medical Visual Question AnsweringQuestion Answering	—Unverified
To Adapt or to Annotate: Challenges and Interventions for Domain Adaptation in Open-Domain Question Answering	Dec 20, 2022	Domain AdaptationOpen-Domain Question Answering	—Unverified
Together we stand: Siamese Networks for Similar Question Retrieval	Aug 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
TokenFocus-VQA: Enhancing Text-to-Image Alignment with Position-Aware Focus and Multi-Perspective Aggregations on LVLMs	Apr 10, 2025	Ensemble LearningPosition	—Unverified
Tokenization Preference for Human and Machine Learning Model: An Annotation Study	Apr 21, 2023	Question Answering	—Unverified
Too Late to Train, Too Early To Use? A Study on Necessity and Viability of Low-Resource Bengali LLMs	Jun 29, 2024	Cross-Lingual TransferDecoder	—Unverified
Tool Calling: Enhancing Medication Consultation via Retrieval-Augmented Large Language Models	Apr 27, 2024	Answer GenerationQuestion Answering	—Unverified
Tools for plWordNet Development. Presentation and Perspectives	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Tools in the Loop: Quantifying Uncertainty of LLM Question Answering Systems That Use Tools	May 22, 2025	Information RetrievalQuestion Answering	—Unverified
Top-down Activity Representation Learning for Video Question Answering	Sep 12, 2024	Question AnsweringRepresentation Learning	—Unverified
Topical Segmentation: a Study of Human Performance and a New Measure of Quality.	Jun 1, 2012	Information RetrievalQuestion Answering	—Unverified
Topic-Based Question Generation	Jan 1, 2018	ChatbotDescriptive	—Unverified

Show:10 25 50

← PrevPage 211 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified