Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5501–5550 of 10817 papers

Title	Date	Tasks	Status
COOL, a Context Outlooker, and its Application to Question Answering and other Natural Language Processing Tasks	Apr 1, 2022	Question Answering	—Unverified
LEAF-QA: Locate, Encode & Attend for Figure Question Answering	Jul 30, 2019	Chart Question AnsweringQuestion Answering	—Unverified
CLIPPO: Image-and-Language Understanding from Pixels Only	Dec 15, 2022	Contrastive Learningimage-classification	—Unverified
Cooking with Semantics	Jun 1, 2014	Question AnsweringSemantic Parsing	—Unverified
DIESEL -- Dynamic Inference-Guidance via Evasion of Semantic Embeddings in LLMs	Nov 28, 2024	Question AnsweringReranking	—Unverified
Analysis of Temporal Expressions Annotated in Clinical Notes	Apr 1, 2015	Information RetrievalKnowledge Base Population	—Unverified
LightPAL: Lightweight Passage Retrieval for Open Domain Multi-Document Summarization	Jun 18, 2024	Document SummarizationLanguage Modelling	—Unverified
DIF: A Framework for Benchmarking and Verifying Implicit Bias in LLMs	May 15, 2025	BenchmarkingFairness	—Unverified
Different Contexts Lead to Different Word Embeddings	Dec 1, 2016	ClusteringInformation Retrieval	—Unverified
Learning a Compositional Semantics for Freebase with an Open Predicate Vocabulary	Jan 1, 2015	Coreference ResolutionOpen Information Extraction	—Unverified
Linking, Searching, and Visualizing Entities in Wikipedia	May 1, 2018	Entity Extraction using GANNamed Entity Recognition (NER)	—Unverified
An Evaluation of Recent Neural Sequence Tagging Models in Turkish Named Entity Recognition	May 14, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
Learning Adaptable Patterns for Passage Reranking	Aug 1, 2013	Feature EngineeringPassage Reranking	—Unverified
Learning Analogy-Preserving Sentence Embeddings for Answer Selection	Oct 11, 2019	Answer SelectionQuestion Answering	—Unverified
LiDAR-LLM: Exploring the Potential of Large Language Models for 3D LiDAR Understanding	Dec 21, 2023	Instruction FollowingLanguage Modeling	—Unverified
Continuous QA Learning with Structured Prompts	Aug 31, 2022	Language ModelingLanguage Modelling	—Unverified
Convolutional Neural Network: Text Classification Model for Open Domain Question Answering System	Sep 7, 2018	General ClassificationInformation Retrieval	—Unverified
Learning Answer Embeddings for Visual Question Answering	Jun 10, 2018	Question AnsweringTransfer Learning	—Unverified
Learning Answer-Entailing Structures for Machine Comprehension	Jul 1, 2015	Multi-Task LearningQuestion Answering	—Unverified
Learning Answer Generation using Supervision from Automatic Question Answering Evaluators	May 24, 2023	Answer GenerationQuestion Answering	—Unverified
IJCNLP-2017 Task 5: Multi-choice Question Answering in Examinations	Dec 1, 2017	Question Answering	—Unverified
Learning Based Approaches for Vietnamese Question Classification Using Keywords Extraction from the Web	Oct 1, 2013	General ClassificationQuestion Answering	—Unverified
Atomic Fact Decomposition Helps Attributed Question Answering	Oct 22, 2024	Knowledge GraphsQuestion Answering	—Unverified
Learning Biological Processes with Global Constraints	Oct 1, 2013	Question Answering	—Unverified
Analysis of Drug repurposing Knowledge graphs for Covid-19	Dec 7, 2022	Graph EmbeddingKnowledge Graph Embedding	—Unverified
Learning by Asking Questions	Dec 4, 2017	Question AnsweringVisual Question Answering	—Unverified
Different Questions, Different Models: Fine-Grained Evaluation of Uncertainty and Calibration in Clinical QA with LLMs	Jun 12, 2025	Multiple-choiceQuestion Answering	—Unverified
Learning by Hallucinating: Vision-Language Pre-training with Weak Supervision	Oct 24, 2022	cross-modal alignmentCross-Modal Retrieval	—Unverified
Learning Compact Lexicons for CCG Semantic Parsing	Oct 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
Learning Compositional Representation for Few-shot Visual Question Answering	Feb 21, 2021	AttributeQuestion Answering	—Unverified
Convolutional Neural Networks vs. Convolution Kernels: Feature Engineering for Answer Sentence Reranking	Jun 1, 2016	Feature EngineeringLearning-To-Rank	—Unverified
LIAF-Net: Leaky Integrate and Analog Fire Network for Lightweight and Efficient Spatiotemporal Information Processing	Nov 12, 2020	Question Answering	—Unverified
Dimensions of Interpersonal Relationships: Corpus and Experiments	Sep 1, 2017	Question Answering	—Unverified
Learning Contextual Embeddings for Structural Semantic Similarity using Categorical Information	Aug 1, 2017	Feature EngineeringQuestion Answering	—Unverified
IITP: Multiobjective Differential Evolution based Twitter Named Entity Recognition	Jul 1, 2015	Machine Translationnamed-entity-recognition	—Unverified
IITP at MEDIQA 2019: Systems Report for Natural Language Inference, Question Entailment and Question Answering	Jun 14, 2019	Medical Question AnsweringNatural Language Inference	—Unverified
Learning Contextually Informed Representations for Linear-Time Discourse Parsing	Sep 1, 2017	Discourse ParsingFeature Engineering	—Unverified
Learning Continuous Word Embedding with Metadata for Question Retrieval in Community Question Answering	Jul 1, 2015	Community Question AnsweringQuestion Answering	—Unverified
Learning Corresponded Rationales for Text Matching	Sep 27, 2018	Natural Language InferenceQuestion Answering	—Unverified
Learning Cross-lingual Representations with Matrix Factorization	Jun 1, 2016	Cross-Lingual Document ClassificationCross-Lingual Semantic Textual Similarity	—Unverified
Convolutional Neural Networks for Aerial Multi-Label Pedestrian Detection	Jul 16, 2018	Action DetectionObject	—Unverified
IIT-KGP at MEDIQA 2019: Recognizing Question Entailment using Sci-BERT stacked with a Gradient Boosting Classifier	Aug 1, 2019	Question AnsweringRetrieval	—Unverified
IISCNLP at SemEval-2016 Task 2: Interpretable STS with ILP based Multiple Chunk Aligner	Jun 1, 2016	Information RetrievalQuestion Answering	—Unverified
Directional Gradient Projection for Robust Fine-Tuning of Foundation Models	Feb 21, 2025	image-classificationImage Classification	—Unverified
ATM: Action Temporality Modeling for Video Question Answering	Sep 5, 2023	Contrastive LearningOptical Flow Estimation	—Unverified
Learning Entailment Relations by Global Graph Structure Optimization	Jan 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Convolutional Interaction Network for Natural Language Inference	Oct 1, 2018	Information RetrievalNatural Language Inference	—Unverified
Learning Executable Semantic Parsers for Natural Language Understanding	Mar 22, 2016	Natural Language UnderstandingQuestion Answering	—Unverified
IIE-NLP-NUT at SemEval-2020 Task 4: Guiding PLM with Prompt Template Reconstruction Strategy for ComVE	Jul 2, 2020	Multiple-choiceQuestion Answering	—Unverified
Lexical Substitution for the Medical Domain	Oct 1, 2014	Natural Language InferenceQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 111 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified