Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7501–7550 of 10817 papers

Title	Date	Tasks	Status
Predicting Difficulty and Discrimination of Natural Language Questions	May 1, 2022	Active LearningQuestion Answering	—Unverified
Predicting Helpful Posts in Open-Ended Discussion Forums: A Neural Architecture	Jun 1, 2019	Community Question AnsweringQuestion Answering	—Unverified
Amharic Question Answering for Biography, Definition, and Description Questions	Aug 1, 2019	Question Answering	—Unverified
Predicting Question-Answering Performance of Large Language Models through Semantic Consistency	Nov 2, 2023	Language ModelingLanguage Modelling	—Unverified
Predicting Question Quality on StackOverflow with Neural Networks	Apr 20, 2024	Question Answering	—Unverified
Predicting Relative Depth between Objects from Semantic Features	Jan 12, 2021	Question AnsweringVisual Question Answering	—Unverified
Predicting Structures in NLP: Constrained Conditional Models and Integer Linear Programming in NLP	Jun 1, 2012	Dependency ParsingFeature Engineering	—Unverified
GRILLBot: A multi-modal conversational agent for complex real-world tasks	Sep 1, 2022	ManagementNavigate	—Unverified
Griffon-G: Bridging Vision-Language and Vision-Centric Tasks via Large Multimodal Models	Oct 21, 2024	Instruction Followingobject-detection	—Unverified
Predicting the Difficulty of Multiple Choice Questions in a High-stakes Medical Exam	Aug 1, 2019	Multiple-choiceQuestion Answering	—Unverified
Comprehensive Study on German Language Models for Clinical and Biomedical Text Understanding	Apr 8, 2024	Domain AdaptationExtractive Question-Answering	—Unverified
Grid Search Hyperparameter Benchmarking of BERT, ALBERT, and LongFormer on DuoRC	Jan 15, 2021	BenchmarkingLanguage Modeling	—Unverified
Grid-LOGAT: Grid Based Local and Global Area Transcription for Video Question Answering	May 30, 2025	Language ModelingLanguage Modelling	—Unverified
Prediction of the Realisation of an Information Need: An EEG Study	Jun 12, 2024	EEGInformation Retrieval	—Unverified
Comprehensive Modeling and Question Answering of Cancer Clinical Practice Guidelines using LLMs	Jan 23, 2025	DiagnosticFew-Shot Learning	—Unverified
Prediction or Comparison: Toward Interpretable Qualitative Reasoning	Jun 4, 2021	PredictionQuestion Answering	—Unverified
Preferred Answer Selection in Stack Overflow: Better Text Representations ... and Metadata, Metadata, Metadata	Nov 1, 2018	Answer SelectionCommunity Question Answering	—Unverified
PREFER: Using a Graph-Based Approach to Generate Paraphrases for Language Learning	Jun 1, 2012	Machine TranslationParaphrase Generation	—Unverified
A Structured Distributional Semantic Model for Event Co-reference	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
A dataset of clinically generated visual questions and answers about radiology images	Nov 20, 2018	Decision MakingMedical Visual Question Answering	—Unverified
Green Prompting	Mar 9, 2025	Code GenerationQuestion Answering	—Unverified
PreSTU: Pre-Training for Scene-Text Understanding	Sep 12, 2022	DecoderImage Captioning	—Unverified
Comprehensive Event Representations using Event Knowledge Graphs and Natural Language Processing	Mar 8, 2023	Event ExtractionKnowledge Graph Completion	—Unverified
Pretrained Encyclopedia: Weakly Supervised Knowledge-Pretrained Language Model	Dec 20, 2019	Entity TypingLanguage Modeling	—Unverified
Pre-trained Transformer-Based Approach for Arabic Question Answering : A Comparative Study	Nov 10, 2021	Question AnsweringReading Comprehension	—Unverified
Face-to-Face Contrastive Learning for Social Intelligence Question-Answering	Jul 29, 2022	Contrastive LearningGraph Neural Network	—Unverified
Pretrained Transformers for Simple Question Answering	May 2, 2019	Knowledge GraphsPrediction	—Unverified
Pretraining and Updates of Domain-Specific LLM: A Case Study in the Japanese Business Domain	Apr 12, 2024	Continual PretrainingGeneral Knowledge	—Unverified
FACTIFY3M: A Benchmark for Multimodal Fact Verification with Explainability through 5W Question-Answering	May 22, 2023	Fact VerificationQuestion Answering	—Unverified
Pre-training, Fine-tuning and Re-ranking: A Three-Stage Framework for Legal Question Answering	Dec 27, 2024	Question AnsweringRepresentation Learning	—Unverified
Pre-training for Information Retrieval: Are Hyperlinks Fully Explored?	Sep 14, 2022	Information RetrievalQuestion Answering	—Unverified
Pre-training image-language transformers for open-vocabulary tasks	Sep 9, 2022	Question AnsweringVisual Entailment	—Unverified
Pre-training Language Models for Comparative Reasoning	May 23, 2023	Question AnsweringQuestion Generation	—Unverified
Pre-training Language Models with Deterministic Factual Knowledge	Oct 20, 2022	Knowledge ProbingQuestion Answering	—Unverified
Greenback Bears and Fiscal Hawks: Finance is a Jungle and Text Embeddings Must Adapt	Nov 11, 2024	Question Answering	—Unverified
Comprehensive Evaluation for a Large Scale Knowledge Graph Question Answering Service	Jan 28, 2025	Graph Question AnsweringNatural Language Queries	—Unverified
A Strong Lexical Matching Method for the Machine Comprehension Test	Sep 1, 2015	Common Sense ReasoningCoreference Resolution	—Unverified
Pre-training Transformer Models with Sentence-Level Objectives for Answer Sentence Selection	May 20, 2022	Answer SelectionQuestion Answering	—Unverified
Pre-training Universal Language Representation	May 30, 2021	Question AnsweringRepresentation Learning	—Unverified
FactTest: Factuality Testing in Large Language Models with Finite-Sample and Distribution-Free Guarantees	Nov 4, 2024	Multiple-choiceQuestion Answering	—Unverified
Pretrain Knowledge-Aware Language Models	Jan 1, 2021	Knowledge ProbingLanguage Modeling	—Unverified
PreWoMe: Exploiting Presuppositions as Working Memory for Long Form Question Answering	Oct 24, 2023	FormLong Form Question Answering	—Unverified
GreaseLM: Graph REASoning Enhanced Language Models	Sep 29, 2021	Knowledge GraphsMedical Question Answering	—Unverified
Comprehensive Audio Query Handling System with Integrated Expert Models and Contextual Understanding	Dec 5, 2024	Audio GenerationAutomatic Speech Recognition	—Unverified
GRASS: Unified Generation Model for Speech-to-Semantic Tasks	Sep 6, 2023	named-entity-recognitionNamed Entity Recognition	—Unverified
GraspCoT: Integrating Physical Property Reasoning for 6-DoF Grasping under Flexible Language Instructions	Mar 20, 2025	Question Answering	—Unverified
Comprehensive and Practical Evaluation of Retrieval-Augmented Generation Systems for Medical Question Answering	Nov 14, 2024	Medical Question AnsweringMisinformation	—Unverified
Privacy Aware Question-Answering System for Online Mental Health Risk Assessment	Jun 9, 2023	DiagnosticQuestion Answering	—Unverified
Privacy Policy Question Answering Assistant: A Query-Guided Extractive Summarization Approach	Sep 29, 2021	Extractive SummarizationQuestion Answering	—Unverified
A strong baseline for question relevancy ranking	Aug 27, 2018	Community Question AnsweringFeature Engineering	—Unverified

Show:10 25 50

← PrevPage 151 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified