Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8901–8950 of 10817 papers

Title	Date	Tasks	Status
LLMs to Support a Domain Specific Knowledge Assistant	Feb 6, 2025	ChatbotMultiple-choice	—Unverified
LM Agents for Coordinating Multi-User Information Gathering	Feb 17, 2025	Document SummarizationMulti-Document Summarization	—Unverified
LMME3DHF: Benchmarking and Evaluating Multimodal 3D Human Face Generation with LMMs	Apr 29, 2025	BenchmarkingFace Generation	—Unverified
LMSim : Computing Domain-specific Semantic Word Similarities Using a Language Modeling Approach	Dec 1, 2014	Information RetrievalLanguage Modeling	—Unverified
Local Convergence of Approximate Newton Method for Two Layer Nonlinear Regression	Nov 26, 2023	Question Answeringregression	—Unverified
Localize, Group, and Select: Boosting Text-VQA by Scene Text Modeling	Aug 20, 2021	Data AblationOptical Character Recognition	—Unverified
Localize, Retrieve and Fuse: A Generalized Framework for Free-Form Question Answering over Tables	Sep 20, 2023	FormGraph Neural Network	—Unverified
Localizing AI: Evaluating Open-Weight Language Models for Languages of Baltic States	Jan 7, 2025	Machine TranslationMultiple-choice	—Unverified
ReFusion: Improving Natural Language Understanding with Computation-Efficient Retrieval Representation Fusion	Jan 4, 2024	Natural Language UnderstandingNeural Architecture Search	CodeCode Available
Meta-Learning for Effective Multi-task and Multilingual Modelling	Jan 25, 2021	Meta-Learningnamed-entity-recognition	CodeCode Available
Improving QA Generalization by Concurrent Modeling of Multiple Biases	Oct 7, 2020	Extractive Question-AnsweringQuestion Answering	CodeCode Available
Improving Quality of a Post's Set of Answers in Stack Overflow	May 30, 2020	Community Question AnsweringQuestion Answering	CodeCode Available
Discourse Representation Structure Parsing	Jul 1, 2018	PredictionQuestion Answering	CodeCode Available
Put It Back: Entity Typing with Language Model Enhancement	Oct 1, 2018	Entity LinkingEntity Typing	CodeCode Available
MAMA: Meta-optimized Angular Margin Contrastive Framework for Video-Language Representation Learning	Jul 4, 2024	Language ModelingLanguage Modelling	CodeCode Available
Improving Question Answering over Incomplete KBs with Knowledge-Aware Reader	May 17, 2019	Question Answering	CodeCode Available
Can a Suit of Armor Conduct Electricity? A New Dataset for Open Book Question Answering	Sep 8, 2018	Question AnsweringRetrieval	CodeCode Available
Improving Question Answering Performance Using Knowledge Distillation and Active Learning	Sep 26, 2021	Active LearningKnowledge Distillation	CodeCode Available
Discourse Comprehension: A Question Answering Framework to Represent Sentence Connections	Nov 1, 2021	Question AnsweringReading Comprehension	CodeCode Available
Improving Question Answering with External Knowledge	Feb 3, 2019	ARCMultiple-choice	CodeCode Available
Open-Ended Multi-Modal Relational Reasoning for Video Question Answering	Dec 1, 2020	Question AnsweringRelational Reasoning	CodeCode Available
Open-Ended Visual Question-Answering	Oct 9, 2016	Question AnsweringSentence	CodeCode Available
Putting People in LLMs' Shoes: Generating Better Answers via Question Rewriter	Aug 20, 2024	Long Form Question AnsweringQuestion Answering	CodeCode Available
Match-Prompt: Improving Multi-task Generalization Ability for Neural Text Matching via Prompt Learning	Apr 6, 2022	Information RetrievalParaphrase Identification	CodeCode Available
Improving Machine Reading Comprehension with General Reading Strategies	Oct 31, 2018	ARCLanguage Modeling	CodeCode Available
Improving Retrieval Augmented Open-Domain Question-Answering with Vectorized Contexts	Apr 2, 2024	In-Context LearningLanguage Modeling	CodeCode Available
Improving Retrieval-Based Question Answering with Deep Inference Models	Dec 7, 2018	Information RetrievalNatural Language Inference	CodeCode Available
Diffusion-Refined VQA Annotations for Semi-Supervised Gaze Following	Jun 4, 2024	Question AnsweringVisual Question Answering	CodeCode Available
Combining Data Generation and Active Learning for Low-Resource Question Answering	Nov 27, 2022	Active LearningAnswer Generation	CodeCode Available
Difficult Task Yes but Simple Task No: Unveiling the Laziness in Multimodal LLMs	Oct 15, 2024	Image DescriptionMultiple-choice	CodeCode Available
Realistic Conversational Question Answering with Answer Selection based on Calibrated Confidence and Uncertainty Measurement	Feb 10, 2023	Answer SelectionConversational Question Answering	CodeCode Available
Rescue: Ranking LLM Responses with Partial Ordering to Improve Response Generation	Nov 15, 2023	Natural Language InferenceQuestion Answering	CodeCode Available
ASQA: Factoid Questions Meet Long-Form Answers	Apr 12, 2022	FormQuestion Answering	CodeCode Available
A dataset and exploration of models for understanding video data through fill-in-the-blank question-answering	Nov 23, 2016	DescriptiveLanguage Modeling	CodeCode Available
MFBE: Leveraging Multi-Field Information of FAQs for Efficient Dense Retrieval	Feb 23, 2023	Question AnsweringRetrieval	CodeCode Available
Improving the Cross-Lingual Generalisation in Visual Question Answering	Sep 7, 2022	Cross-Lingual TransferQuestion Answering	CodeCode Available
Differentiating Choices via Commonality for Multiple-Choice Question Answering	Aug 21, 2024	Multiple-choiceMultiple Choice Question Answering (MCQA)	CodeCode Available
MFE-ETP: A Comprehensive Evaluation Benchmark for Multi-modal Foundation Models on Embodied Task Planning	Jul 6, 2024	Embodied Question AnsweringQuestion Answering	CodeCode Available
Improving the Robustness of Question Answering Systems to Question Paraphrasing	Jul 1, 2019	Data AugmentationQuestion Answering	CodeCode Available
OpenKE: An Open Toolkit for Knowledge Embedding	Nov 1, 2018	Information RetrievalKnowledge Graphs	CodeCode Available
Revisiting Semantic Representation and Tree Search for Similar Question Retrieval	Aug 22, 2019	AllInformation Retrieval	CodeCode Available
Differential Attention for Visual Question Answering	Apr 1, 2018	Question AnsweringVisual Question Answering	CodeCode Available
RealMedQA: A pilot biomedical question answering dataset containing realistic clinical questions	Aug 16, 2024	Question Answering	CodeCode Available
MHSAN: Multi-Head Self-Attention Network for Visual Semantic Embedding	Jan 11, 2020	Image CaptioningImage-text Retrieval	CodeCode Available
From Multiple-Choice to Extractive QA: A Case Study for English and Arabic	Apr 26, 2024	BelebeleExtractive Question-Answering	CodeCode Available
CaLMQA: Exploring culturally specific long-form question answering across 23 languages	Jun 25, 2024	FormLong Form Question Answering	CodeCode Available
Differentiable Outlier Detection Enable Robust Deep Multimodal Analysis	Feb 11, 2023	Image-text RetrievalKnowledge Graphs	CodeCode Available
Micro-Act: Mitigate Knowledge Conflict in Question Answering via Actionable Self-Reasoning	Jun 5, 2025	Question AnsweringRAG	CodeCode Available
Aspect-based Sentiment Analysis in Question Answering Forums	Nov 1, 2021	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available
BUZZ: Beehive-structured Sparse KV Cache with Segmented Heavy Hitters for Efficient LLM Inference	Oct 30, 2024	Computational EfficiencyQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 179 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified