Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6601–6650 of 10817 papers

Title	Date	Tasks	Status
Language Models are Causal Knowledge Extractors for Zero-shot Video Question Answering	Apr 7, 2023	Question AnsweringQuestion Generation	—Unverified
Detect, Describe, Discriminate: Moving Beyond VQA for MLLM Evaluation	Sep 23, 2024	Multiple-choiceQuestion Answering	—Unverified
Language Model Pre-training for Hierarchical Document Representations	Jan 26, 2019	Document SummarizationExtractive Document Summarization	—Unverified
Detect2Interact: Localizing Object Key Field in Visual Question Answering (VQA) with LLMs	Apr 1, 2024	Common Sense ReasoningObject	—Unverified
Language Model is All You Need: Natural Language Understanding as Question Answering	Nov 5, 2020	AllLanguage Modeling	—Unverified
Multi-Row, Multi-Span Distant Supervision For Table+Text Question	Dec 14, 2021	Question AnsweringReading Comprehension	—Unverified
Language Model-Guided Knowledge Subgraphs for Question Answering	Nov 16, 2021	Knowledge GraphsLanguage Modeling	—Unverified
Multi-Level Alignments As An Extensible Representation Basis for Textual Entailment Algorithms	Jun 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
Multi-Level Attention Networks for Visual Question Answering	Jul 1, 2017	Question AnsweringVisual Question Answering	—Unverified
Multi-Level Explanations for Generative Language Models	Mar 21, 2024	Question Answeringtext-classification	—Unverified
Multi-level Gated Recurrent Neural Network for Dialog Act Classification	Oct 4, 2019	ClassificationDialog Act Classification	—Unverified
Despite "super-human" performance, current LLMs are unsuited for decisions about ethics and safety	Dec 13, 2022	Common Sense ReasoningEthics	—Unverified
Multilingual Aliasing for Auto-Generating Proposition Banks	Dec 1, 2016	Machine TranslationQuestion Answering	—Unverified
Multilingual Answer Sentence Reranking via Automatically Translated Data	Feb 20, 2021	Question AnsweringReranking	—Unverified
Multilingual Augmentation for Robust Visual Question Answering in Remote Sensing Images	Apr 7, 2023	Contrastive LearningQuestion Answering	—Unverified
Multilingual European Language Models: Benchmarking Approaches and Challenges	Feb 18, 2025	BenchmarkingQuestion Answering	—Unverified
Multilingual Image Corpus – Towards a Multimodal and Multilingual Dataset	Jun 1, 2022	Caption Generationimage-classification	—Unverified
Multilingual Medical Question Answering and Information Retrieval for Rural Health Intelligence Access	Jun 2, 2021	Information RetrievalMedical Question Answering	—Unverified
LEMON: LanguagE ModeL for Negative Sampling of Knowledge Graph Embeddings	Mar 9, 2022	Graph EmbeddingKnowledge Graph Embedding	—Unverified
Language Is Not All You Need: Aligning Perception with Language Models	Feb 27, 2023	AllImage Captioning	—Unverified
Bactrainus: Optimizing Large Language Models for Multi-hop Complex Question Answering Tasks	Jan 10, 2025	Multi-hop Question AnsweringNatural Language Understanding	—Unverified
Multilingual Question Answering from Formatted Text applied to Conversational Agents	Oct 10, 2019	Extractive Question-AnsweringMachine Translation	—Unverified
A Neural Comprehensive Ranker (NCR) for Open-Domain Question Answering	Sep 29, 2017	Open-Domain Question AnsweringPassage Ranking	—Unverified
Multilingual Retrieval-Augmented Generation for Knowledge-Intensive Task	Apr 4, 2025	Open-Domain Question AnsweringQuestion Answering	—Unverified
Adversarial Attacks Beyond the Image Space	Nov 20, 2017	Question AnsweringVisual Question Answering	—Unverified
Multilingual Supervision of Semantic Annotation	Dec 1, 2016	Question AnsweringRelation Extraction	—Unverified
Language Independent Sentence-Level Subjectivity Analysis with Feature Selection	Nov 1, 2012	feature selectionMachine Translation	—Unverified
Multilingual Transfer Learning for QA Using Translation as Data Augmentation	Dec 10, 2020	Cross-Lingual TransferData Augmentation	—Unverified
Multilingual Universal Sentence Encoder for Semantic Retrieval	Jul 9, 2019	Question AnsweringRetrieval	—Unverified
Multilingual WSD-like Constraints for Paraphrase Extraction	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
Designing Templates for Eliciting Commonsense Knowledge from Pretrained Sequence-to-Sequence Models	Dec 1, 2020	Multiple-choiceNatural Language Understanding	—Unverified
MultiMed: Massively Multimodal and Multitask Medical Understanding	Aug 22, 2024	BenchmarkingMedical Question Answering	—Unverified
Multimodal Adaptive Distillation for Leveraging Unimodal Encoders for Vision-Language Tasks	Apr 22, 2022	Question AnsweringVisual Commonsense Reasoning	—Unverified
Language-Image Models with 3D Understanding	May 6, 2024	Question AnsweringVisual Question Answering	—Unverified
Multimodal ArXiv: A Dataset for Improving Scientific Comprehension of Large Vision-Language Models	Mar 1, 2024	BenchmarkingMathematical Reasoning	—Unverified
BACON: Improving Clarity of Image Captions via Bag-of-Concept Graphs	Jul 3, 2024	Image CaptioningImage Generation	—Unverified
Language Features Matter: Effective Language Representations for Vision-Language Tasks	Aug 17, 2019	Image CaptioningLanguage Modelling	—Unverified
Multimodal Commonsense Knowledge Distillation for Visual Question Answering	Nov 5, 2024	Knowledge DistillationQuestion Answering	—Unverified
Multimodal Compact Bilinear Pooling for Multimodal Neural Machine Translation	Mar 23, 2017	DecoderMachine Translation	—Unverified
Multimodal Continuous Visual Attention Mechanisms	Apr 7, 2021	ClusteringQuestion Answering	—Unverified
Multimodal Datasets and Benchmarks for Reasoning about Dynamic Spatio-Temporality in Everyday Environments	Aug 21, 2024	Question Answering	—Unverified
Multimodal DBN for Predicting High-Quality Answers in cQA portals	Aug 1, 2013	Question AnsweringText Classification	—Unverified
Designing dialogue systems: A mean, grumpy, sarcastic chatbot in the browser	Sep 20, 2019	ChatbotDecoder	—Unverified
Multimodal Dialogue State Tracking By QA Approach with Data Augmentation	Jul 20, 2020	Data AugmentationDecoder	—Unverified
Language bias in Visual Question Answering: A Survey and Taxonomy	Nov 16, 2021	Question AnsweringVisual Question Answering	—Unverified
Multimodal Dual Attention Memory for Video Story Question Answering	Sep 21, 2018	Question Answering	—Unverified
Language-aware Visual Semantic Distillation for Video Question Answering	Jan 1, 2024	Answer GenerationQuestion Answering	—Unverified
Designing a Robust Radiology Report Generation System	Nov 2, 2024	Decision MakingDiagnostic	—Unverified
Backward and Forward Language Modeling for Constrained Sentence Generation	Dec 21, 2015	Language ModelingLanguage Modelling	—Unverified
Langforia: Language Pipelines for Annotating Large Collections of Documents	Dec 1, 2016	ArticlesDependency Parsing	—Unverified

Show:10 25 50

← PrevPage 133 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified