Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10751–10800 of 10817 papers

Title	Date	Tasks	Status
Türkçe Dil Modellerinin Performans Karşılaştırması Performance Comparison of Turkish Language Models	Apr 25, 2024	In-Context LearningQuestion Answering	—Unverified
Turkish Paraphrase Corpus	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
TVBench: Redesigning Video-Language Evaluation	Oct 10, 2024	Multiple-choiceOpen-Ended Question Answering	—Unverified
TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning	Feb 29, 2024	Question AnsweringVideo Understanding	—Unverified
TWEETQA: A Social Media Focused Question Answering Dataset	Jul 14, 2019	ArticlesQuestion Answering	—Unverified
TwiRGCN: Temporally Weighted Graph Convolution for Question Answering over Temporal Knowledge Graphs	Oct 12, 2022	Knowledge GraphsQuestion Answering	—Unverified
Twitter Named Entity Extraction and Linking Using Differential Evolution	Dec 1, 2016	Entity Extraction using GANEntity Linking	—Unverified
Twitter Paraphrase Identification with Simple Overlap Features and SVMs	Jun 1, 2015	Information RetrievalMachine Translation	—Unverified
Two can play this Game: Visual Dialog with Discriminative Question Generation and Answering	Mar 29, 2018	Image CaptioningQuestion Answering	—Unverified
Two is Better Than One: Answering Complex Questions by Multiple Knowledge Sources with Generalized Links	Sep 11, 2023	Entity AlignmentQuestion Answering	—Unverified
Two-Layer Retrieval-Augmented Generation Framework for Low-Resource Medical Question Answering Using Reddit Data: Proof-of-Concept Study	May 29, 2024	Answer GenerationHallucination	—Unverified
Two-stage Generative Question Answering on Temporal Knowledge Graph Using Large Language Models	Feb 26, 2024	Answer GenerationGenerative Question Answering	—Unverified
Two-Turn Debate Doesn't Help Humans Answer Hard Reading Comprehension Questions	Oct 19, 2022	Language ModelingLanguage Modelling	—Unverified
TxT: Crossmodal End-to-End Learning with Transformers	Sep 9, 2021	Multimodal ReasoningQuestion Answering	—Unverified
Type-Constrained Representation Learning in Knowledge Graphs	Aug 11, 2015	Knowledge Graph CompletionKnowledge Graphs	—Unverified
Type-dependent Prompt CycleQAG : Cycle Consistency for Multi-hop Question Generation	Oct 1, 2022	Answer GenerationLogical Reasoning	—Unverified
Type Prediction Systems	Apr 2, 2021	Entity DisambiguationKnowledge Base Question Answering	—Unverified
Typhoon: Thai Large Language Models	Dec 21, 2023	Question AnsweringWorld Knowledge	—Unverified
Typologie des questions \`a r\'eponses multiples pour un syst\`eme de question-r\'eponse (Typology of Multiple Answer Questions for a Question-answering System) [in French]	Jun 1, 2012	Question Answering	—Unverified
UBY - A Large-Scale Unified Lexical-Semantic Resource Based on LMF	Apr 1, 2012	Question AnsweringSemantic Role Labeling	—Unverified
UC2: Universal Cross-lingual Cross-modal Vision-and-Language Pre-training	Apr 1, 2021	Image-text matchingImage-text Retrieval	—Unverified
U-CAM: Visual Explanation using Uncertainty based Class Activation Maps	Aug 17, 2019	Deep LearningProbabilistic Deep Learning	—Unverified
UCCIX: Irish-eXcellence Large Language Model	May 13, 2024	BenchmarkingLanguage Modeling	—Unverified
SearchLVLMs: A Plug-and-Play Framework for Augmenting Large Vision-Language Models by Searching Up-to-Date Internet Knowledge	May 23, 2024	Question AnsweringRAG	—Unverified
UFO: A UniFied TransfOrmer for Vision-Language Representation Learning	Nov 19, 2021	Image CaptioningImage-text matching	—Unverified
UFRGSent at SemEval-2022 Task 10: Structured Sentiment Analysis using a Question Answering Model	Jul 1, 2022	PositionQuestion Answering	—Unverified
UHop: An Unrestricted-Hop Relation Extraction Framework for Knowledge-Based Question Answering	Apr 2, 2019	Question AnsweringRelation	—Unverified
UH-PRHLT at SemEval-2016 Task 3: Combining Lexical and Semantic-based Features for Community Question Answering	Jul 30, 2018	Community Question AnsweringKnowledge Graphs	—Unverified
Uhura: A Benchmark for Evaluating Scientific Question Answering and Truthfulness in Low-Resource African Languages	Dec 1, 2024	ARCMultiple-choice	—Unverified
UINSUSKA-TiTech at SemEval-2017 Task 3: Exploiting Word Importance Levels for Similarity Features for CQA	Aug 1, 2017	Community Question AnsweringKnowledge Graphs	—Unverified
UIT-E10dot3 at SemEval-2021 Task 5: Toxic Spans Detection with Named Entity Recognition and Question-Answering Approaches	Apr 15, 2021	named-entity-recognitionNamed Entity Recognition	—Unverified
UIT-Saviors at MEDVQA-GI 2023: Improving Multimodal Learning with Image Enhancement for Gastrointestinal Visual Question Answering	Jul 6, 2023	DiagnosticImage Enhancement	—Unverified
UKP: Computing Semantic Textual Similarity by Combining Multiple Content Similarity Measures	Jul 1, 2012	Machine TranslationNatural Language Inference	—Unverified
UMB@PerAnsSumm 2025: Enhancing Perspective-Aware Summarization with Prompt Optimization and Supervised Fine-Tuning	Mar 14, 2025	Community Question AnsweringEnsemble Learning	—Unverified
UMCC\_DLSI-(EPS): Paraphrases Detection Based on Semantic Distance	Jun 1, 2013	Information RetrievalParaphrase Identification	—Unverified
UMCC\_DLSI: Multidimensional Lexical-Semantic Textual Similarity	Jul 1, 2012	Machine TranslationNamed Entity Recognition (NER)	—Unverified
UMCC\_DLSI: Textual Similarity based on Lexical-Semantic features	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
UMD-TTIC-UW at SemEval-2016 Task 1: Attention-Based Multi-Perspective Convolutional Neural Networks for Textual Similarity Measurement	Jun 1, 2016	Feature EngineeringQuestion Answering	—Unverified
UMichigan: A Conditional Random Field Model for Resolving the Scope of Negation	Jul 1, 2012	NegationQuestion Answering	—Unverified
UMLS-KGI-BERT: Data-Centric Knowledge Integration in Transformers for Biomedical Entity Recognition	Jul 20, 2023	Document Classificationnamed-entity-recognition	—Unverified
Um novo corpo e os seus desafios (A new corpus and the challenges it offers)	Nov 1, 2015	Question AnsweringSentiment Analysis	—Unverified
Unanimous Prediction for 100\% Precision with Application to Learning Semantic Mappings	Aug 1, 2016	Question AnsweringSemantic Parsing	—Unverified
Unanswerable Questions about Images and Texts	Jan 25, 2021	Question AnsweringVisual Question Answering	—Unverified
UNCC Biomedical Semantic Question Answering Systems. BioASQ: Task-7B, Phase-B	Feb 5, 2020	Question Answering	—Unverified
UNCC QA: Biomedical Question Answering system	Nov 1, 2018	Extractive SummarizationQuestion Answering	—Unverified
Uncertainty-Aware Attention Heads: Efficient Unsupervised Uncertainty Quantification for LLMs	May 26, 2025	HallucinationQuestion Answering	—Unverified
Uncertainty-Aware Fusion: An Ensemble Framework for Mitigating Hallucinations in Large Language Models	Feb 22, 2025	HallucinationQuestion Answering	—Unverified
Uncertainty-aware Language Modeling for Selective Question Answering	Nov 26, 2023	Language ModelingLanguage Modelling	—Unverified
Uncertainty-Based Abstention in LLMs Improves Safety and Reduces Hallucinations	Apr 16, 2024	Question Answering	—Unverified
Uncertainty based Class Activation Maps for Visual Question Answering	Jan 23, 2020	Deep LearningProbabilistic Deep Learning	—Unverified

Show:10 25 50

← PrevPage 216 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified