Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1701–1750 of 10817 papers

Title	Date	Tasks	Status	Hype	Score
KVLink: Accelerating Large Language Models via Efficient KV Cache Reuse	Feb 21, 2025	Question Answering	CodeCode Available	1	5
CommonsenseQA: A Question Answering Challenge Targeting Commonsense Knowledge	Nov 2, 2018	Common Sense ReasoningMultiple-choice	CodeCode Available	1	5
KnowTuning: Knowledge-aware Fine-tuning for Large Language Models	Feb 17, 2024	Medical Question AnsweringQuestion Answering	CodeCode Available	1	5
Can an AI Win Ghana's National Science and Maths Quiz? An AI Grand Challenge for Education	Jan 30, 2023	MathPosition	CodeCode Available	1	5
Generator-Retriever-Generator Approach for Open-Domain Question Answering	Jul 21, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
GeoQA: A Geometric Question Answering Benchmark Towards Multimodal Numerical Reasoning	May 30, 2021	MathMathematical Reasoning	CodeCode Available	1	5
Can ChatGPT Understand Too? A Comparative Study on ChatGPT and Fine-tuned BERT	Feb 19, 2023	Question AnsweringSentiment Analysis	CodeCode Available	1	5
Genixer: Empowering Multimodal Large Language Models as a Powerful Data Generator	Dec 11, 2023	Image CaptioningQuestion Answering	CodeCode Available	1	5
Context-Aware Alignment and Mutual Masking for 3D-Language Pre-Training	Jan 1, 2023	3D dense captioning3D visual grounding	CodeCode Available	1	5
GENOME: GenerativE Neuro-symbOlic visual reasoning by growing and reusing ModulEs	Nov 8, 2023	Question AnsweringReferring Expression	CodeCode Available	1	5
Know What You Don't Know: Unanswerable Questions for SQuAD	Jun 11, 2018	Natural Language UnderstandingQuestion Answering	CodeCode Available	1	5
Language Guided Visual Question Answering: Elevate Your Multimodal Language Model Using Knowledge-Enriched Prompts	Oct 31, 2023	Image CaptioningLanguage Modeling	CodeCode Available	1	5
Large Language Models can be Guided to Evade AI-Generated Text Detection	May 18, 2023	Question AnsweringText Detection	CodeCode Available	1	5
Glance and Focus: Memory Prompting for Multi-Event Video Question Answering	Jan 3, 2024	Action DetectionHuman-Object Interaction Detection	CodeCode Available	1	5
Can Explanations Be Useful for Calibrating Black Box Models?	Oct 14, 2021	Extractive Question-AnsweringFew-Shot Learning	CodeCode Available	1	5
Question Answering Classification for Amharic Social Media Community Based Questions	Jun 1, 2022	8kQuestion Answering	CodeCode Available	1	5
Knowledge Guided Text Retrieval and Reading for Open Domain Question Answering	Nov 10, 2019	Natural QuestionsOpen-Domain Question Answering	CodeCode Available	1	5
Can Generative Pre-trained Language Models Serve as Knowledge Bases for Closed-book QA?	Jun 3, 2021	Question Answering	CodeCode Available	1	5
Knowledge-guided Open Attribute Value Extraction with Reinforcement Learning	Oct 19, 2020	ArticlesAttribute	CodeCode Available	1	5
Knowledge Infused Decoding	Apr 6, 2022	counterfactualQuestion Answering	CodeCode Available	1	5
Collab-RAG: Boosting Retrieval-Augmented Generation for Complex Question Answering via White-Box and Black-Box LLM Collaboration	Apr 7, 2025	Language ModelingLanguage Modelling	CodeCode Available	1	5
CoLoR-Filter: Conditional Loss Reduction Filtering for Targeted Language Model Pre-training	Jun 15, 2024	Domain AdaptationLanguage Modeling	CodeCode Available	1	5
Knowledge Graph Question Answering Datasets and Their Generalizability: Are They Enough for Future Research?	May 13, 2022	Graph Question AnsweringKnowledge Graphs	CodeCode Available	1	5
Can Language Models Solve Graph Problems in Natural Language?	May 17, 2023	In-Context LearningKnowledge Probing	CodeCode Available	1	5
GooAQ: Open Question Answering with Diverse Answer Types	Apr 18, 2021	Open-Ended Question AnsweringQuestion Answering	CodeCode Available	1	5
Are self-explanations from Large Language Models faithful?	Jan 15, 2024	counterfactualFaithfulness Critic	CodeCode Available	1	5
Cognitive Visual-Language Mapper: Advancing Multimodal Comprehension with Enhanced Visual Knowledge Alignment	Feb 21, 2024	Language ModellingQuestion Answering	CodeCode Available	1	5
Knowledge Graph Question Answering using Graph-Pattern Isomorphism	Mar 11, 2021	Domain AdaptationGraph Question Answering	CodeCode Available	1	5
A Survey of Medical Vision-and-Language Applications and Their Techniques	Nov 19, 2024	Decision MakingDiagnostic	CodeCode Available	1	5
Combo of Thinking and Observing for Outside-Knowledge VQA	May 10, 2023	DecoderQuestion Answering	CodeCode Available	1	5
Knowledge Graph Simple Question Answering for Unseen Domains	May 25, 2020	Domain AdaptationQuestion Answering	CodeCode Available	1	5
Grape: Knowledge Graph Enhanced Passage Reader for Open-domain Question Answering	Oct 6, 2022	Entity EmbeddingsGraph Neural Network	CodeCode Available	1	5
Knowledge-Routed Visual Question Reasoning: Challenges for Deep Representation Embedding	Dec 14, 2020	Question AnsweringVisual Question Answering	CodeCode Available	1	5
Code-Style In-Context Learning for Knowledge-Based Question Answering	Sep 9, 2023	Code GenerationIn-Context Learning	CodeCode Available	1	5
CogMG: Collaborative Augmentation Between Large Language Model and Knowledge Graph	Jun 25, 2024	Knowledge Graph CompletionKnowledge Graphs	CodeCode Available	1	5
Can NLI Models Verify QA Systems' Predictions?	Apr 18, 2021	Natural Language InferenceQuestion Answering	CodeCode Available	1	5
Can NLI Models Verify QA Systems’ Predictions?	Nov 1, 2021	Natural Language InferenceQuestion Answering	CodeCode Available	1	5
GraphNeT: Graph neural networks for neutrino telescope event reconstruction	Oct 21, 2022	Question Answering	CodeCode Available	1	5
Knowledge graph enhanced retrieval-augmented generation for failure mode and effects analysis	Jun 26, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Knowledge Graph-based Question Answering with Electronic Health Records	Oct 19, 2020	Natural Language QueriesQuestion Answering	CodeCode Available	1	5
CodeQA: A Question Answering Dataset for Source Code Comprehension	Sep 17, 2021	Machine Reading ComprehensionQuestion Answering	CodeCode Available	1	5
Graphusion: Leveraging Large Language Models for Scientific Knowledge Graph Fusion and Construction in NLP Education	Jul 15, 2024	graph constructionKnowledge Graphs	CodeCode Available	1	5
Knowledge Graph Embedding Methods for Entity Alignment: An Experimental Review	Mar 17, 2022	AttributeEntity Alignment	CodeCode Available	1	5
CAT-ViL: Co-Attention Gated Vision-Language Embedding for Visual Question Localized-Answering in Robotic Surgery	Jul 11, 2023	Question AnsweringScene Understanding	CodeCode Available	1	5
Can questions summarize a corpus? Using question generation for characterizing COVID-19 research	Sep 19, 2020	ArticlesQuestion Answering	CodeCode Available	1	5
Can Retriever-Augmented Language Models Reason? The Blame Game Between the Retriever and the Language Model	Dec 18, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
Coarse-to-Fine Vision-Language Pre-training with Fusion in the Backbone	Jun 15, 2022	Described Object DetectionImage Captioning	CodeCode Available	1	5
Knowledge Editing with Dynamic Knowledge Graphs for Multi-Hop Question Answering	Dec 18, 2024	graph constructionknowledge editing	CodeCode Available	1	5
Rainier: Reinforced Knowledge Introspector for Commonsense Question Answering	Oct 6, 2022	Question AnsweringReinforcement Learning (RL)	CodeCode Available	1	5
COBRA: Contrastive Bi-Modal Representation Algorithm	May 7, 2020	Cross-Modal RetrievalImage Captioning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 35 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified