Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7651–7700 of 10817 papers

Title	Date	Tasks	Status
Provoking Multi-modal Few-Shot LVLM via Exploration-Exploitation In-Context Learning	Jun 11, 2025	In-Context LearningQuestion Answering	—Unverified
I've got the "Answer"! Interpretation of LLMs Hidden States in Question Answering	Jun 4, 2024	Question Answering	—Unverified
DaNetQA: a yes/no Question Answering Dataset for the Russian Language	Oct 6, 2020	Question AnsweringSentence	—Unverified
Prune Once for All: Sparse Pre-Trained Language Models	Nov 10, 2021	AllNatural Language Inference	—Unverified
It was the training data pruning too!	Mar 12, 2018	Question Answering	—Unverified
It Takes Two to Tango: Towards Theory of AI's Mind	Apr 3, 2017	AttributeQuestion Answering	—Unverified
It Takes Two to Tango: Navigating Conceptualizations of NLP Tasks and Measurements of Performance	May 15, 2023	coreference-resolutionCoreference Resolution	—Unverified
PSLM: Parallel Generation of Text and Speech with LLMs for Low-Latency Spoken Dialogue Systems	Jun 18, 2024	Language ModelingLanguage Modelling	—Unverified
Damage Assessment after Natural Disasters with UAVs: Semantic Feature Extraction using Deep Learning	Dec 14, 2024	Decision MakingQuestion Answering	—Unverified
Automatically Extracting Procedural Knowledge from Instructional Texts using Natural Language Processing	May 1, 2012	Question Answering	—Unverified
Psy-LLM: Scaling up Global Mental Health Psychological Services with AI-based Large Language Models	Jul 22, 2023	ArticlesQuestion Answering	—Unverified
An Efficient Active Learning Framework for New Relation Types	Oct 1, 2013	Active LearningQuestion Answering	—Unverified
It Takes Three to Tango: Triangulation Approach to Answer Ranking in Community Question Answering	Nov 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
It's High Time: A Survey of Temporal Information Retrieval and Question Answering	May 26, 2025	ArticlesInformation Retrieval	—Unverified
It's About Time: Incorporating Temporality in Retrieval Augmented Language Models	Jan 24, 2024	Few-Shot LearningHallucination	—Unverified
Punctuation Prediction with Transition-based Parsing	Aug 1, 2013	Dependency ParsingLanguage Modelling	—Unverified
ITNLP-AiKF at SemEval-2016 Task 3 a quesiton answering system using community QA repository	Jun 1, 2016	Answer SelectionCommunity Question Answering	—Unverified
Pushing the boundary on Natural Language Inference	Apr 25, 2025	Fact CheckingInformation Retrieval	—Unverified
Pushing the Limits of AMR Parsing with Self-Learning	Oct 20, 2020	Abstract Meaning RepresentationAMR Parsing	—Unverified
Pushing the Limits of ChatGPT on NLP Tasks	Jun 16, 2023	Dependency ParsingEvent Extraction	—Unverified
DAHRS: Divergence-Aware Hallucination-Remediated SRL Projection	Jul 12, 2024	fr-enHallucination	—Unverified
Pushing the Limits of Radiology with Joint Modeling of Visual and Textual Information	Jul 1, 2018	Image ClassificationMachine Translation	—Unverified
Automatically Developing a Fine-grained Arabic Named Entity Corpus and Gazetteer by utilizing Wikipedia	Oct 1, 2013	Question AnsweringTransliteration	—Unverified
It is AI’s Turn to Ask Humans a Question: Question-Answer Pair Generation for Children’s Story Books	May 1, 2022	Answer GenerationQuestion-Answer-Generation	—Unverified
It is AI’s Turn to Ask Human a Question: Question and Answer Pair Generation for Children Storybooks in FairytaleQA Dataset	Nov 16, 2021	Answer GenerationQuestion-Answer-Generation	—Unverified
PuzzleBench: Can LLMs Solve Challenging First-Order Combinatorial Reasoning Problems?	Feb 4, 2024	Question Answering	—Unverified
DAFE: LLM-Based Evaluation Through Dynamic Arbitration for Free-Form Question-Answering	Mar 11, 2025	FormInstruction Following	—Unverified
PVChat: Personalized Video Chat with One-Shot Learning	Mar 21, 2025	One-Shot LearningQuestion Answering	—Unverified
ITFormer: Bridging Time Series and Natural Language for Multi-Modal QA with Large-Scale Multitask Dataset	Jun 25, 2025	Computational EfficiencyQuestion Answering	—Unverified
Pyramid-Driven Alignment: Pyramid Principle Guided Integration of Large Language Models and Knowledge Graphs	Oct 16, 2024	Knowledge GraphsQuestion Answering	—Unverified
DADgraph: A Discourse-aware Dialogue Graph Neural Network for Multiparty Dialogue Machine Reading Comprehension	Apr 26, 2021	Graph Neural NetworkMachine Reading Comprehension	—Unverified
Automated Utterance Generation	Apr 7, 2020	Extractive SummarizationQuestion Answering	—Unverified
An Effective Multi-Stage Approach For Question Answering	Jul 10, 2019	Machine Reading ComprehensionNatural Language Understanding	—Unverified
Advancements and Challenges in Bangla Question Answering Models: A Comprehensive Review	Dec 16, 2024	ArticlesQuestion Answering	—Unverified
Iterative Utility Judgment Framework via LLMs Inspired by Relevance in Philosophy	Jun 17, 2024	Answer GenerationInformation Retrieval	—Unverified
Q^2Forge: Minting Competency Questions and SPARQL Queries for Question-Answering Over Knowledge Graphs	May 19, 2025	Knowledge GraphsQuestion Answering	—Unverified
Iterative Scene Graph Generation with Generative Transformers	Nov 30, 2022	Graph GenerationLink Prediction	—Unverified
Iterative Multi-document Neural Attention for Multiple Answer Prediction	Feb 8, 2017	PredictionQuestion Answering	—Unverified
Iterative Adversarial Attack on Image-guided Story Ending Generation	May 16, 2023	Adversarial AttackAdversarial Robustness	—Unverified
Iterated learning for emergent systematicity in VQA	May 3, 2021	Question AnsweringSystematic Generalization	—Unverified
Cycle-Consistency for Robust Visual Question Answering	Feb 15, 2019	Question AnsweringQuestion Generation	—Unverified
Automated Testing and Improvement of Named Entity Recognition Systems	Aug 14, 2023	named-entity-recognitionNamed Entity Recognition	—Unverified
An Effective Contextual Language Modeling Framework for Speech Summarization with Augmented Features	Jun 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Is This Just Fantasy? Language Model Representations Reflect Human Judgments of Event Plausibility	Jul 16, 2025	Language ModelingLanguage Modelling	—Unverified
"Is This It?": Towards Ecologically Valid Benchmarks for Situated Collaboration	Aug 30, 2024	Embodied Question AnsweringQuestion Answering	—Unverified
CyberBOT: Towards Reliable Cybersecurity Education via Ontology-Grounded Retrieval Augmented Generation	Apr 1, 2025	ChatbotQuestion Answering	—Unverified
Is Table Retrieval a Solved Problem? Exploring Join-Aware Multi-Table Retrieval	Apr 15, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified
QADiver: Interactive Framework for Diagnosing QA Models	Dec 1, 2018	Question Answering	—Unverified
QA Domain Adaptation using Data Augmentation and Contrastive Adaptation	Nov 16, 2021	Data AugmentationDomain Adaptation	—Unverified
Is Summary Useful or Not? An Extrinsic Human Evaluation of Text Summaries on Downstream Tasks	May 24, 2023	InformativenessQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 154 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified