Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10401–10425 of 10817 papers

Title	Date	Tasks	Status
Training-free LLM Merging for Multi-task Learning	Jun 14, 2025	Multiple-choiceMulti-Task Learning	CodeCode Available
Using the Poly-encoder for a COVID-19 Question Answering System	Dec 1, 2020	MisinformationQuestion Answering	CodeCode Available
When an LLM is apprehensive about its answers -- and when its uncertainty is justified	Mar 3, 2025	MathMMLU	CodeCode Available
SDNet: Contextualized Attention-based Deep Network for Conversational Question Answering	Dec 10, 2018	Conversational Question AnsweringCoreference Resolution	CodeCode Available
Securing Vision-Language Models with a Robust Encoder Against Jailbreak and Adversarial Attacks	Sep 11, 2024	Image CaptioningQuestion Answering	CodeCode Available
Sequential Attention with Keyword Mask Model for Community-based Question Answering	Jun 1, 2019	Answer SelectionQuestion Answering	CodeCode Available
Training-Free Exponential Context Extension via Cascading KV Cache	Jun 24, 2024	Book summarizationComputational Efficiency	CodeCode Available
Sequence-to-Sequence Spanish Pre-trained Language Models	Sep 20, 2023	DecoderGenerative Question Answering	CodeCode Available
Transferable and Efficient Non-Factual Content Detection via Probe Training with Offline Consistency Checking	Apr 10, 2024	Question Answering	CodeCode Available
Utilize the Flow before Stepping into the Same River Twice: Certainty Represented Knowledge Flow for Refusal-Aware Instruction Tuning	Oct 9, 2024	HallucinationMultiple-choice	CodeCode Available
Utilizing Background Knowledge for Robust Reasoning over Traffic Situations	Dec 4, 2022	Knowledge GraphsMultiple-choice	CodeCode Available
Utilizing BERT for Aspect-Based Sentiment Analysis via Constructing Auxiliary Sentence	Mar 22, 2019	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available
Texts or Images? A Fine-grained Analysis on the Effectiveness of Input Representations and Models for Table Question Answering	May 20, 2025	Question Answering	CodeCode Available
Long Context Question Answering via Supervised Contrastive Learning	Dec 16, 2021	Contrastive LearningQuestion Answering	CodeCode Available
SecQA: A Concise Question-Answering Dataset for Evaluating Large Language Models in Computer Security	Dec 26, 2023	Computer SecurityMultiple-choice	CodeCode Available
When in Doubt, Ask: Generating Answerable and Unanswerable Questions, Unsupervised	Oct 4, 2020	Language ModelingLanguage Modelling	CodeCode Available
Transfer Learning via Unsupervised Task Discovery for Visual Question Answering	Oct 3, 2018	Question AnsweringTransfer Learning	CodeCode Available
Transfer Learning with Synthetic Corpora for Spatial Role Labeling and Reasoning	Oct 30, 2022	Question AnsweringTransfer Learning	CodeCode Available
TRAQ: Trustworthy Retrieval Augmented Question Answering via Conformal Prediction	Jul 7, 2023	Bayesian OptimizationChatbot	CodeCode Available
Scoring and Classifying Implicit Positive Interpretations: A Challenge of Class Imbalance	Aug 1, 2018	General ClassificationNatural Language Inference	CodeCode Available
Transformer-based Language Models for Factoid Question Answering at BioASQ9b	Sep 15, 2021	Question Answering	CodeCode Available
VnCoreNLP: A Vietnamese Natural Language Processing Toolkit	Jan 4, 2018	Dependency Parsingnamed-entity-recognition	CodeCode Available
Source-Free Domain Adaptation for Question Answering with Masked Self-training	Dec 19, 2022	Domain AdaptationQuestion Answering	CodeCode Available
SOrT-ing VQA Models : Contrastive Gradient Learning for Improved Consistency	Oct 20, 2020	Question AnsweringVisual Grounding	CodeCode Available
Track the Answer: Extending TextVQA from Image to Video with Spatio-Temporal Clues	Dec 17, 2024	Language ModelingLanguage Modelling	CodeCode Available

Show:10 25 50

← PrevPage 417 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified