Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1601–1650 of 10817 papers

Title	Date	Tasks	Status	Hype	Score
Code-Style In-Context Learning for Knowledge-Based Question Answering	Sep 9, 2023	Code GenerationIn-Context Learning	CodeCode Available	1	5
CogMG: Collaborative Augmentation Between Large Language Model and Knowledge Graph	Jun 25, 2024	Knowledge Graph CompletionKnowledge Graphs	CodeCode Available	1	5
JMedLoRA:Medical Domain Adaptation on Japanese Large Language Models using Instruction-tuning	Oct 16, 2023	Domain AdaptationMedical Question Answering	CodeCode Available	1	5
Break It Down: A Question Understanding Benchmark	Jan 31, 2020	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1	5
CodeQA: A Question Answering Dataset for Source Code Comprehension	Sep 17, 2021	Machine Reading ComprehensionQuestion Answering	CodeCode Available	1	5
Exploring Perceptual Limitation of Multimodal Large Language Models	Feb 12, 2024	ObjectQuestion Answering	CodeCode Available	1	5
COBRA: Contrastive Bi-Modal Representation Algorithm	May 7, 2020	Cross-Modal RetrievalImage Captioning	CodeCode Available	1	5
Bridging Anaphora Resolution as Question Answering	Apr 16, 2020	Bridging Anaphora ResolutionQuestion Answering	CodeCode Available	1	5
JDocQA: Japanese Document Question Answering Dataset for Generative Language Models	Mar 28, 2024	HallucinationQuestion Answering	CodeCode Available	1	5
JointLK: Joint Reasoning with Language Models and Knowledge Graphs for Commonsense Question Answering	Dec 6, 2021	Knowledge GraphsQuestion Answering	CodeCode Available	1	5
Coarse-to-Fine Vision-Language Pre-training with Fusion in the Backbone	Jun 15, 2022	Described Object DetectionImage Captioning	CodeCode Available	1	5
Expressive Scene Graph Generation Using Commonsense Knowledge Infusion for Visual Understanding and Reasoning	May 31, 2022	Common Sense ReasoningGraph Generation	CodeCode Available	1	5
Exposing Shallow Heuristics of Relation Extraction Models with Challenge Data	Oct 7, 2020	AttributeQuestion Answering	CodeCode Available	1	5
ExpMRC: Explainability Evaluation for Machine Reading Comprehension	May 10, 2021	Machine Reading ComprehensionMulti-Choice MRC	CodeCode Available	1	5
Coarse-to-Fine Reasoning for Visual Question Answering	Oct 6, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1	5
Bridging the Gap between 2D and 3D Visual Question Answering: A Fusion Approach for 3D VQA	Feb 24, 2024	3D Question Answering (3D-QA)Question Answering	CodeCode Available	1	5
Jack the Reader - A Machine Reading Framework	Jun 20, 2018	ArticlesLink Prediction	CodeCode Available	1	5
CAT-ViL: Co-Attention Gated Vision-Language Embedding for Visual Question Localized-Answering in Robotic Surgery	Jul 11, 2023	Question AnsweringScene Understanding	CodeCode Available	1	5
A Gradually Soft Multi-Task and Data-Augmented Approach to Medical Question Understanding	Aug 1, 2021	Data AugmentationDecoder	CodeCode Available	1	5
FaceBench: A Multi-View Multi-Level Facial Attribute VQA Dataset for Benchmarking Face Perception MLLMs	Mar 27, 2025	AttributeBenchmarking	CodeCode Available	1	5
Answer is All You Need: Instruction-following Text Embedding via Answering the Question	Feb 15, 2024	abstractive question answeringAll	CodeCode Available	1	5
Fabricator: An Open Source Toolkit for Generating Labeled Training Data with Teacher LLMs	Sep 18, 2023	Dataset GenerationQuestion Answering	CodeCode Available	1	5
Bridging the KB-Text Gap: Leveraging Structured Knowledge-aware Pre-training for KBQA	Aug 28, 2023	Knowledge Base Question AnsweringQuestion Answering	CodeCode Available	1	5
A Cross-Task Analysis of Text Span Representations	Jun 6, 2020	coreference-resolutionCoreference Resolution	CodeCode Available	1	5
OpenCQA: Open-ended Question Answering with Charts	Oct 12, 2022	Arithmetic ReasoningDescriptive	CodeCode Available	1	5
Open-Domain Question Answering Goes Conversational via Question Rewriting	Oct 10, 2020	Conversational Question AnsweringOpen-Domain Question Answering	CodeCode Available	1	5
It is AI's Turn to Ask Humans a Question: Question-Answer Pair Generation for Children's Story Books	Sep 8, 2021	Answer GenerationData Augmentation	CodeCode Available	1	5
Faithful Multimodal Explanation for Visual Question Answering	Sep 8, 2018	Explanatory Visual Question AnsweringQuestion Answering	CodeCode Available	1	5
JaQuAD: Japanese Question Answering Dataset for Machine Reading Comprehension	Feb 3, 2022	ArticlesMachine Reading Comprehension	CodeCode Available	1	5
A Comprehensive Review of the Video-to-Text Problem	Mar 27, 2021	Question AnsweringRetrieval	CodeCode Available	1	5
A Survey on Efficient Vision-Language Models	Apr 13, 2025	Image CaptioningQuestion Answering	CodeCode Available	1	5
BRIEF: Bridging Retrieval and Inference for Multi-hop Reasoning via Compression	Oct 20, 2024	In-Context LearningLong-Context Understanding	CodeCode Available	1	5
Invoke Interfaces Only When Needed: Adaptive Invocation for Large Language Models in Question Answering	May 5, 2025	HallucinationQuestion Answering	CodeCode Available	1	5
IoT-LM: Large Multisensory Language Models for the Internet of Things	Jul 13, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Clues Before Answers: Generation-Enhanced Multiple-Choice QA	Apr 30, 2022	DecoderMultiple-choice	CodeCode Available	1	5
Bring Your Own KG: Self-Supervised Program Synthesis for Zero-Shot KGQA	Nov 14, 2023	In-Context LearningProgram Synthesis	CodeCode Available	1	5
FastFiD: Improve Inference Efficiency of Open Domain Question Answering via Sentence Selection	Aug 12, 2024	Answer GenerationDecoder	CodeCode Available	1	5
FastAdaSP: Multitask-Adapted Efficient Inference for Large Speech Language Model	Oct 3, 2024	Emotion RecognitionLanguage Modeling	CodeCode Available	1	5
CLTR: An End-to-End, Transformer-Based System for Cell Level Table Retrieval and Table Question Answering	Jun 8, 2021	Question AnsweringRetrieval	CodeCode Available	1	5
Overcoming Data Limitation in Medical Visual Question Answering	Sep 26, 2019	DenoisingMedical Visual Question Answering	CodeCode Available	1	5
Fauno: The Italian Large Language Model that will leave you senza parole!	Jun 26, 2023	GPULanguage Modeling	CodeCode Available	1	5
Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation	Jul 20, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1	5
Closed Loop Neural-Symbolic Learning via Integrating Neural Perception, Grammar Parsing, and Symbolic Reasoning	Jun 11, 2020	Question AnsweringReinforcement Learning (RL)	CodeCode Available	1	5
FeTaQA: Free-form Table Question Answering	Apr 1, 2021	FormQuestion Answering	CodeCode Available	1	5
FEQA: A Question Answering Evaluation Framework for Faithfulness Assessment in Abstractive Summarization	May 7, 2020	Abstractive Text SummarizationQuestion Answering	CodeCode Available	1	5
PAKTON: A Multi-Agent Framework for Question Answering in Long Legal Agreements	May 31, 2025	Privacy PreservingQuestion Answering	CodeCode Available	1	5
Clover: Towards A Unified Video-Language Alignment and Fusion Model	Jul 16, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
Few-shot In-context Learning for Knowledge Base Question Answering	May 2, 2023	In-Context LearningKnowledge Base Question Answering	CodeCode Available	1	5
CLIP-Guided Vision-Language Pre-training for Question Answering in 3D Scenes	Apr 12, 2023	Question AnsweringVisual Question Answering	CodeCode Available	1	5
CL-ReLKT: Cross-lingual Language Knowledge Transfer for Multilingual Retrieval Question Answering	Jul 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5

Show:10 25 50

← PrevPage 33 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified