Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10401–10450 of 10817 papers

Title	Date	Tasks	Status
Training-free LLM Merging for Multi-task Learning	Jun 14, 2025	Multiple-choiceMulti-Task Learning	CodeCode Available
Using the Poly-encoder for a COVID-19 Question Answering System	Dec 1, 2020	MisinformationQuestion Answering	CodeCode Available
When an LLM is apprehensive about its answers -- and when its uncertainty is justified	Mar 3, 2025	MathMMLU	CodeCode Available
SDNet: Contextualized Attention-based Deep Network for Conversational Question Answering	Dec 10, 2018	Conversational Question AnsweringCoreference Resolution	CodeCode Available
Securing Vision-Language Models with a Robust Encoder Against Jailbreak and Adversarial Attacks	Sep 11, 2024	Image CaptioningQuestion Answering	CodeCode Available
Sequential Attention with Keyword Mask Model for Community-based Question Answering	Jun 1, 2019	Answer SelectionQuestion Answering	CodeCode Available
Training-Free Exponential Context Extension via Cascading KV Cache	Jun 24, 2024	Book summarizationComputational Efficiency	CodeCode Available
Sequence-to-Sequence Spanish Pre-trained Language Models	Sep 20, 2023	DecoderGenerative Question Answering	CodeCode Available
Transferable and Efficient Non-Factual Content Detection via Probe Training with Offline Consistency Checking	Apr 10, 2024	Question Answering	CodeCode Available
Utilize the Flow before Stepping into the Same River Twice: Certainty Represented Knowledge Flow for Refusal-Aware Instruction Tuning	Oct 9, 2024	HallucinationMultiple-choice	CodeCode Available
Utilizing Background Knowledge for Robust Reasoning over Traffic Situations	Dec 4, 2022	Knowledge GraphsMultiple-choice	CodeCode Available
Utilizing BERT for Aspect-Based Sentiment Analysis via Constructing Auxiliary Sentence	Mar 22, 2019	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available
Texts or Images? A Fine-grained Analysis on the Effectiveness of Input Representations and Models for Table Question Answering	May 20, 2025	Question Answering	CodeCode Available
Long Context Question Answering via Supervised Contrastive Learning	Dec 16, 2021	Contrastive LearningQuestion Answering	CodeCode Available
SecQA: A Concise Question-Answering Dataset for Evaluating Large Language Models in Computer Security	Dec 26, 2023	Computer SecurityMultiple-choice	CodeCode Available
When in Doubt, Ask: Generating Answerable and Unanswerable Questions, Unsupervised	Oct 4, 2020	Language ModelingLanguage Modelling	CodeCode Available
Transfer Learning via Unsupervised Task Discovery for Visual Question Answering	Oct 3, 2018	Question AnsweringTransfer Learning	CodeCode Available
Transfer Learning with Synthetic Corpora for Spatial Role Labeling and Reasoning	Oct 30, 2022	Question AnsweringTransfer Learning	CodeCode Available
TRAQ: Trustworthy Retrieval Augmented Question Answering via Conformal Prediction	Jul 7, 2023	Bayesian OptimizationChatbot	CodeCode Available
Scoring and Classifying Implicit Positive Interpretations: A Challenge of Class Imbalance	Aug 1, 2018	General ClassificationNatural Language Inference	CodeCode Available
Transformer-based Language Models for Factoid Question Answering at BioASQ9b	Sep 15, 2021	Question Answering	CodeCode Available
VnCoreNLP: A Vietnamese Natural Language Processing Toolkit	Jan 4, 2018	Dependency Parsingnamed-entity-recognition	CodeCode Available
Source-Free Domain Adaptation for Question Answering with Masked Self-training	Dec 19, 2022	Domain AdaptationQuestion Answering	CodeCode Available
SOrT-ing VQA Models : Contrastive Gradient Learning for Improved Consistency	Oct 20, 2020	Question AnsweringVisual Grounding	CodeCode Available
Track the Answer: Extending TextVQA from Image to Video with Spatio-Temporal Clues	Dec 17, 2024	Language ModelingLanguage Modelling	CodeCode Available
Transformer Module Networks for Systematic Generalization in Visual Question Answering	Jan 27, 2022	Question AnsweringSystematic Generalization	CodeCode Available
Public Attitudes Toward ChatGPT on Twitter: Sentiments, Topics, and Occupations	Jun 22, 2023	ChatbotLanguage Modelling	CodeCode Available
VOGUE: Answer Verbalization through Multi-Task Learning	Jun 24, 2021	Answer GenerationKnowledge Graphs	CodeCode Available
Solla: Towards a Speech-Oriented LLM That Hears Acoustic Context	Mar 19, 2025	Audio captioningAudio Question Answering	CodeCode Available
TQA-Bench: Evaluating LLMs for Multi-Table Question Answering with Scalable Context and Symbolic Extension	Nov 29, 2024	8kQuestion Answering	CodeCode Available
Sequence to sequence pretraining for a less-resourced Slovenian language	Jul 28, 2022	Language ModelingLanguage Modelling	CodeCode Available
Towards Zero-Shot Conditional Summarization with Adaptive Multi-Task Fine-Tuning	Nov 1, 2020	Question Answering	CodeCode Available
Towards Visual Question Answering on Pathology Images	Aug 1, 2021	Decision MakingQuestion Answering	CodeCode Available
Transforming Dependency Structures to Logical Forms for Semantic Parsing	Jan 1, 2016	Question AnsweringSemantic Parsing	CodeCode Available
Towards Transparent Interactive Semantic Parsing via Step-by-Step Correction	Oct 15, 2021	Question AnsweringSemantic Parsing	CodeCode Available
Valencer: an API to Query Valence Patterns in FrameNet	Dec 1, 2016	Question Answering	CodeCode Available
Text Simplification for Comprehension-based Question-Answering	Sep 28, 2021	Machine TranslationQuestion Answering	CodeCode Available
When Retriever-Reader Meets Scenario-Based Multiple-Choice Questions	Aug 31, 2021	Multiple-choiceQuestion Answering	CodeCode Available
Refiner: Restructure Retrieval Content Efficiently to Advance Question-Answering Capabilities	Jun 17, 2024	Question AnsweringRAG	CodeCode Available
Vamos: Versatile Action Models for Video Understanding	Nov 22, 2023	EgoSchemaHard Attention	CodeCode Available
Transition-based Semantic Role Labeling with Pointer Networks	May 20, 2022	Machine TranslationQuestion Answering	CodeCode Available
Text Generation: A Systematic Literature Review of Tasks, Evaluation, and Challenges	May 24, 2024	Document SummarizationMulti-Document Summarization	CodeCode Available
Translating Place-Related Questions to GeoSPARQL Queries	May 6, 2022	Geographic Question AnsweringQuestion Answering	CodeCode Available
VoQA: Visual-only Question Answering	May 20, 2025	Question Answering	CodeCode Available
VANiLLa : Verbalized Answers in Natural Language at Large Scale	May 24, 2021	BIG-bench Machine LearningKnowledge Graphs	CodeCode Available
Soft-Prompting with Graph-of-Thought for Multi-modal Representation Learning	Apr 6, 2024	Domain GeneralizationImage Retrieval	CodeCode Available
Text Fact Transfer	Oct 23, 2023	Question AnsweringQuestion Generation	CodeCode Available
TextBugger: Generating Adversarial Text Against Real-world Applications	Dec 13, 2018	Adversarial TextMachine Translation	CodeCode Available
Transparency by Design: Closing the Gap Between Performance and Interpretability in Visual Reasoning	Mar 14, 2018	Question AnsweringVisual Question Answering	CodeCode Available
SODAPOP: Open-Ended Discovery of Social Biases in Social Commonsense Reasoning Models	Oct 13, 2022	DiagnosticLanguage Modeling	CodeCode Available

Show:10 25 50

← PrevPage 209 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified