Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1626–1650 of 10817 papers

Title	Date	Tasks	Status	Hype	Score
Open-Domain Question Answering Goes Conversational via Question Rewriting	Oct 10, 2020	Conversational Question AnsweringOpen-Domain Question Answering	CodeCode Available	1	5
It is AI's Turn to Ask Humans a Question: Question-Answer Pair Generation for Children's Story Books	Sep 8, 2021	Answer GenerationData Augmentation	CodeCode Available	1	5
Faithful Multimodal Explanation for Visual Question Answering	Sep 8, 2018	Explanatory Visual Question AnsweringQuestion Answering	CodeCode Available	1	5
JaQuAD: Japanese Question Answering Dataset for Machine Reading Comprehension	Feb 3, 2022	ArticlesMachine Reading Comprehension	CodeCode Available	1	5
A Comprehensive Review of the Video-to-Text Problem	Mar 27, 2021	Question AnsweringRetrieval	CodeCode Available	1	5
A Survey on Efficient Vision-Language Models	Apr 13, 2025	Image CaptioningQuestion Answering	CodeCode Available	1	5
BRIEF: Bridging Retrieval and Inference for Multi-hop Reasoning via Compression	Oct 20, 2024	In-Context LearningLong-Context Understanding	CodeCode Available	1	5
Invoke Interfaces Only When Needed: Adaptive Invocation for Large Language Models in Question Answering	May 5, 2025	HallucinationQuestion Answering	CodeCode Available	1	5
IoT-LM: Large Multisensory Language Models for the Internet of Things	Jul 13, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Clues Before Answers: Generation-Enhanced Multiple-Choice QA	Apr 30, 2022	DecoderMultiple-choice	CodeCode Available	1	5
Bring Your Own KG: Self-Supervised Program Synthesis for Zero-Shot KGQA	Nov 14, 2023	In-Context LearningProgram Synthesis	CodeCode Available	1	5
FastFiD: Improve Inference Efficiency of Open Domain Question Answering via Sentence Selection	Aug 12, 2024	Answer GenerationDecoder	CodeCode Available	1	5
FastAdaSP: Multitask-Adapted Efficient Inference for Large Speech Language Model	Oct 3, 2024	Emotion RecognitionLanguage Modeling	CodeCode Available	1	5
CLTR: An End-to-End, Transformer-Based System for Cell Level Table Retrieval and Table Question Answering	Jun 8, 2021	Question AnsweringRetrieval	CodeCode Available	1	5
Overcoming Data Limitation in Medical Visual Question Answering	Sep 26, 2019	DenoisingMedical Visual Question Answering	CodeCode Available	1	5
Fauno: The Italian Large Language Model that will leave you senza parole!	Jun 26, 2023	GPULanguage Modeling	CodeCode Available	1	5
Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation	Jul 20, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1	5
Closed Loop Neural-Symbolic Learning via Integrating Neural Perception, Grammar Parsing, and Symbolic Reasoning	Jun 11, 2020	Question AnsweringReinforcement Learning (RL)	CodeCode Available	1	5
FeTaQA: Free-form Table Question Answering	Apr 1, 2021	FormQuestion Answering	CodeCode Available	1	5
FEQA: A Question Answering Evaluation Framework for Faithfulness Assessment in Abstractive Summarization	May 7, 2020	Abstractive Text SummarizationQuestion Answering	CodeCode Available	1	5
PAKTON: A Multi-Agent Framework for Question Answering in Long Legal Agreements	May 31, 2025	Privacy PreservingQuestion Answering	CodeCode Available	1	5
Clover: Towards A Unified Video-Language Alignment and Fusion Model	Jul 16, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
Few-shot In-context Learning for Knowledge Base Question Answering	May 2, 2023	In-Context LearningKnowledge Base Question Answering	CodeCode Available	1	5
CLIP-Guided Vision-Language Pre-training for Question Answering in 3D Scenes	Apr 12, 2023	Question AnsweringVisual Question Answering	CodeCode Available	1	5
CL-ReLKT: Cross-lingual Language Knowledge Transfer for Multilingual Retrieval Question Answering	Jul 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5

Show:10 25 50

← PrevPage 66 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified