Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8951–8975 of 10817 papers

Title	Date	Tasks	Status
OpenTable-R1: A Reinforcement Learning Augmented Tool Agent for Open-Domain Table Question Answering	Jul 2, 2025	Language ModelingLanguage Modelling	CodeCode Available
Improving Zero-shot Visual Question Answering via Large Language Models with Reasoning Question Prompts	Nov 15, 2023	Question AnsweringSentence	CodeCode Available
Aspect-based Sentiment Analysis in Question Answering Forums	Nov 1, 2021	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available
Did the Model Understand the Question?	May 14, 2018	modelQuestion Answering	CodeCode Available
MIMO: A Medical Vision Language Model with Visual Referring Multimodal Input and Pixel Grounding Multimodal Output	Jan 1, 2025	Instruction FollowingLanguage Modeling	CodeCode Available
Answer Complex Questions: Path Ranker Is All You Need	Jul 11, 2021	AllOpen-Domain Question Answering	CodeCode Available
QuASE: Question-Answer Driven Sentence Encoding	Sep 1, 2019	named-entity-recognitionNamed Entity Recognition	CodeCode Available
OpenViVQA: Task, Dataset, and Multimodal Fusion Models for Visual Question Answering in Vietnamese	May 7, 2023	Information RetrievalQuestion Answering	CodeCode Available
A Comparative Study of Question Answering over Knowledge Bases	Nov 15, 2022	DiversityQuestion Answering	CodeCode Available
Combining Data Generation and Active Learning for Low-Resource Question Answering	Nov 27, 2022	Active LearningAnswer Generation	CodeCode Available
Open-Vocabulary Semantic Parsing with both Distributional Statistics and Formal Knowledge	Jul 12, 2016	Question AnsweringSemantic Parsing	CodeCode Available
In-Context Principle Learning from Mistakes	Feb 8, 2024	GSM8KIn-Context Learning	CodeCode Available
Incorporating brain-inspired mechanisms for multimodal learning in artificial intelligence	May 15, 2025	Computational EfficiencyContinual Learning	CodeCode Available
Dice Loss for Data-imbalanced NLP Tasks	Nov 7, 2019	Chinese Named Entity RecognitionMachine Reading Comprehension	CodeCode Available
Dialogue Benchmark Generation from Knowledge Graphs with Cost-Effective Retrieval-Augmented LLMs	Jan 17, 2025	Dialogue GenerationKnowledge Graphs	CodeCode Available
Building a Swedish Question-Answering Model	Jun 1, 2020	Machine Translationmodel	CodeCode Available
Incorporating Label Dependency for Answer Quality Tagging in Community Question Answering via CNN-LSTM-CRF	Dec 1, 2016	Community Question AnsweringQuestion Answering	CodeCode Available
Building a Non-Trivial Paraphrase Corpus Using Multiple Machine Translation Systems	Jul 1, 2017	Information RetrievalMachine Translation	CodeCode Available
Incorporating Probing Signals into Multimodal Machine Translation via Visual Question-Answering Pairs	Oct 26, 2023	AttributeMachine Translation	CodeCode Available
Dialog-to-Action: Conversational Question Answering Over a Large-Scale Knowledge Base	Dec 1, 2018	Conversational Question AnsweringDecoder	CodeCode Available
Improving language models by retrieving from trillions of tokens	Dec 8, 2021	Language ModellingQuestion Answering	CodeCode Available
OPERA: Harmonizing Task-Oriented Dialogs and Information Seeking Experience	Jun 24, 2022	Question Answering	CodeCode Available
Diagnosing Medical Datasets with Training Dynamics	Nov 3, 2024	Medical Question AnsweringQuestion Answering	CodeCode Available
Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering	Dec 16, 2019	Dialogue GenerationKnowledge Base Question Answering	CodeCode Available
Improving Health Question Answering with Reliable and Time-Aware Evidence Retrieval	Apr 12, 2024	ArticlesQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 359 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified