Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10701–10750 of 10817 papers

Title	Date	Tasks	Status
Transfer and Multi-Task Learning for Noun--Noun Compound Interpretation	Oct 1, 2018	General ClassificationInformation Retrieval	—Unverified
Transfer in Deep Reinforcement Learning using Knowledge Graphs	Aug 19, 2019	Deep Reinforcement LearningKnowledge Graphs	—Unverified
Transfer Learning and Masked Generation for Answer Verbalization	Jul 1, 2022	Answer GenerationQuestion Answering	—Unverified
Transfer Learning Based Cross-lingual Knowledge Extraction for Wikipedia	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Transfer Learning Enhanced Single-choice Decision for Multi-choice Question Answering	Apr 27, 2024	Binary ClassificationLanguage Modeling	—Unverified
Transfer Learning in Visual and Relational Reasoning	Nov 27, 2019	Question AnsweringRelational Reasoning	—Unverified
Transferring Domain-Agnostic Knowledge in Video Question Answering	Oct 26, 2021	Question AnsweringTransfer Learning	—Unverified
Transformer-Based Models for Question Answering on COVID19	Jan 16, 2021	Question Answering	—Unverified
Transformer based Natural Language Generation for Question-Answering	Dec 1, 2020	Question AnsweringText Generation	—Unverified
Transformer-based Subject Entity Detection in Wikipedia Listings	Oct 4, 2022	Knowledge GraphsQuestion Answering	—Unverified
Transformers Can Compose Skills To Solve Novel Problems Without Finetuning	Sep 17, 2021	Question AnsweringSemantic Similarity	—Unverified
Transformer Semantic Parsing	Dec 1, 2020	DecoderQuestion Answering	—Unverified
Transformers in Vision: A Survey	Jan 4, 2021	Action RecognitionActivity Recognition	—Unverified
Transforming Wearable Data into Health Insights using Large Language Model Agents	Jun 10, 2024	Code GenerationInformation Retrieval	—Unverified
Transforming Wikipedia into a Large-Scale Fine-Grained Entity Type Corpus	May 1, 2018	Entity LinkingEntity Typing	—Unverified
Transform-Retrieve-Generate: Natural Language-Centric Outside-Knowledge Visual Question Answering	Jan 1, 2022	Generative Question AnsweringImage to text	—Unverified
TransG : A Generative Model for Knowledge Graph Embedding	Aug 1, 2016	Dimensionality ReductionGraph Embedding	—Unverified
Transition-based Dependency DAG Parsing Using Dynamic Oracles	Jul 1, 2015	Dependency ParsingFeature Engineering	—Unverified
Translating Natural Language to SQL using Pointer-Generator Networks and How Decoding Order Matters	Nov 13, 2018	Question AnsweringSemantic Parsing	—Unverified
Translating Questions into Answers using DBPedia n-triples	Mar 7, 2018	Question Answering	—Unverified
Translating Web Search Queries into Natural Language Questions	Feb 7, 2020	Community Question AnsweringMachine Translation	—Unverified
Translation Deserves Better: Analyzing Translation Artifacts in Cross-lingual Visual Question Answering	Jun 4, 2024	Data AugmentationMachine Translation	—Unverified
Transliteration Better than Translation? Answering Code-mixed Questions over a Knowledge Base	Jul 1, 2018	Automatic Speech Recognition (ASR)Information Retrieval	—Unverified
TransMamba: Fast Universal Architecture Adaption from Transformers to Mamba	Feb 21, 2025	image-classificationImage Classification	—Unverified
Leveraging Expert Input for Robust and Explainable AI-Assisted Lung Cancer Detection in Chest X-rays	Mar 28, 2024	Binary ClassificationDecision Making	—Unverified
TransWiC at SemEval-2021 Task 2: Transformer-based Multilingual and Cross-lingual Word-in-Context Disambiguation	Apr 9, 2021	Information RetrievalQuestion Answering	—Unverified
TRAVELER: A Benchmark for Evaluating Temporal Reasoning across Vague, Implicit and Explicit References	May 2, 2025	Natural Language UnderstandingQuestion Answering	—Unverified
TraveLLaMA: Facilitating Multi-modal Large Language Models to Understand Urban Scenes and Provide Travel Assistance	Apr 23, 2025	Question AnsweringScene Understanding	—Unverified
Treat us like the sequences we are: Prepositional Paraphrasing of Noun Compounds using LSTM	Aug 1, 2018	Machine TranslationQuestion Answering	—Unverified
Treebanking by Sentence and Tree Transformation: Building a Treebank to support Question Answering in Portuguese	May 1, 2012	Question AnsweringSentence	—Unverified
Tree Memory Networks for Modelling Long-term Temporal Dependencies	Mar 12, 2017	Machine TranslationPart-Of-Speech Tagging	—Unverified
Tree of Reviews: A Tree-based Dynamic Iterative Retrieval Framework for Multi-hop Question Answering	Apr 22, 2024	DiversityMulti-hop Question Answering	—Unverified
Triangulating LLM Progress through Benchmarks, Games, and Cognitive Tests	Feb 20, 2025	Logical ReasoningMMLU	—Unverified
Trick Me If You Can: Adversarial Writing of Trivia Challenge Questions	Jul 1, 2018	Question Answering	—Unverified
Triggering Multi-Hop Reasoning for Question Answering in Language Models using Soft Prompts and Random Walks	Jun 6, 2023	Knowledge GraphsQuestion Answering	—Unverified
Triplet-Aware Scene Graph Embeddings	Sep 19, 2019	Data AugmentationGraph Embedding	—Unverified
Tri-VQA: Triangular Reasoning Medical Visual Question Answering for Multi-Attribute Analysis	Jun 21, 2024	AttributeMedical Visual Question Answering	—Unverified
TrojVLM: Backdoor Attack Against Vision Language Models	Sep 28, 2024	Backdoor AttackImage Captioning	—Unverified
TRRNet: Tiered Relation Reasoning for Compositional Visual Question Answering	Aug 1, 2020	ObjectQuestion Answering	—Unverified
Trust, Accountability, and Autonomy in Knowledge Graph-based AI for Self-determination	Oct 30, 2023	Decision MakingKnowledge Graphs	—Unverified
Trusting Language Models in Education	Aug 7, 2023	Question Answering	—Unverified
Trustworthy Graph Neural Networks: Aspects, Methods and Trends	May 16, 2022	Drug DiscoveryEdge-computing	—Unverified
TruthLens:A Training-Free Paradigm for DeepFake Detection	Mar 19, 2025	Binary ClassificationDeepFake Detection	—Unverified
TruthTeller: Annotating Predicate Truth	Jun 1, 2013	Question Answering	—Unverified
Trying Bilinear Pooling in Video-QA	Dec 18, 2020	Question AnsweringVideo Question Answering	—Unverified
TTQA-RS- A break-down prompting approach for Multi-hop Table-Text Question Answering with Reasoning and Summarization	Jun 20, 2024	Information RetrievalQuestion Answering	—Unverified
TueFact at SemEval 2019 Task 8: Fact checking in community question answering forums: context matters	Jun 1, 2019	Community Question AnsweringFact Checking	—Unverified
TunBERT: Pretrained Contextualized Text Representation for Tunisian Dialect	Nov 25, 2021	ArticlesDialect Identification	—Unverified
Tuning HeidelTime for identifying time expressions in clinical texts in English and French	Apr 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
Turk Bootstrap Word Sense Inventory 2.0: A Large-Scale Resource for Lexical Substitution	May 1, 2012	Machine TranslationQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 215 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified