Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6251–6300 of 10817 papers

Title	Date	Tasks	Status
Meta-Embeddings for Natural Language Inference and Semantic Similarity tasks	Dec 1, 2020	Natural Language InferenceQuestion Answering	—Unverified
Metaethical Perspectives on 'Benchmarking' AI Ethics	Apr 11, 2022	BenchmarkingEthics	—Unverified
Tensor Train Low-rank Approximation (TT-LoRA): Democratizing AI with Accelerated LLMs	Aug 2, 2024	Machine TranslationModel Compression	—Unverified
Metaheuristic Approaches to Lexical Substitution and Simplification	Apr 1, 2017	Lexical SimplificationMachine Translation	—Unverified
How to Make a BLT Sandwich? Learning to Reason towards Understanding Web Instructional Videos	Dec 2, 2018	Logical ReasoningQuestion Answering	—Unverified
Continual Pre-Training for Cross-Lingual LLM Adaptation: Enhancing Japanese Language Capabilities	Apr 27, 2024	Question Answering	—Unverified
EfficientEQA: An Efficient Approach for Open Vocabulary Embodied Question Answering	Oct 26, 2024	Efficient ExplorationEmbodied Question Answering	—Unverified
A corpus of general and specific sentences from news	May 1, 2012	ArticlesGeneral Classification	—Unverified
How to find a good image-text embedding for remote sensing visual question answering?	Sep 24, 2021	Question AnsweringVisual Question Answering	—Unverified
Metamorphic Relation Based Adversarial Attacks on Differentiable Neural Computer	Sep 7, 2018	Question AnsweringRelation	—Unverified
Efficient Global Learning of Entailment Graphs	Jun 1, 2015	Question Answering	—Unverified
Meta-prompting Optimized Retrieval-augmented Generation	Jul 4, 2024	Multi-hop Question AnsweringQuestion Answering	—Unverified
How to Evaluate Opinionated Keyphrase Extraction?	Jul 1, 2012	Keyphrase ExtractionMachine Translation	—Unverified
MetaQA: Combining Expert Agents for Multi-Skill Question Answering	Jan 16, 2022	Question Answering	—Unverified
MetaReflection: Learning Instructions for Language Agents using Past Reflections	May 13, 2024	Logical ReasoningQuestion Answering	—Unverified
MetaToken: Detecting Hallucination in Image Descriptions by Meta Classification	May 29, 2024	HallucinationImage Captioning	—Unverified
Continually Self-Improving Language Models for Bariatric Surgery Question--Answering	May 22, 2025	Large Language ModelMisinformation	—Unverified
A Few-Shot Learning Focused Survey on Recent Named Entity Recognition and Relation Classification Methods	Oct 29, 2023	ClassificationFew-Shot Learning	—Unverified
Method of Tibetan Person Knowledge Extraction	Apr 11, 2016	graph constructionInformation Retrieval	—Unverified
Methods Combination and ML-based Re-ranking of Multiple Hypothesis for Question-Answering Systems	Apr 1, 2012	Information RetrievalQuestion Answering	—Unverified
Modular Graph Attention Network for Complex Visual Relational Reasoning	Nov 22, 2020	Graph AttentionQuestion Answering	—Unverified
Modulating Language Model Experiences through Frictions	Jun 24, 2024	FrictionInformation Retrieval	—Unverified
EfficientLLaVA: Generalizable Auto-Pruning for Large Vision-language Models	Jan 1, 2025	MM-VetMultimodal Reasoning	—Unverified
A Survey on Recent Advances in Sequence Labeling from Deep Learning Models	Nov 13, 2020	ChunkingGraph Embedding	—Unverified
Efficiently Embedding Dynamic Knowledge Graphs	Oct 15, 2019	Graph EmbeddingKnowledge Graph Embedding	—Unverified
MFORT-QA: Multi-hop Few-shot Open Rich Table Question Answering	Mar 28, 2024	Few-Shot LearningQuestion Answering	—Unverified
How to Design Sample and Computationally Efficient VQA Models	Mar 22, 2021	Question AnsweringVisual Question Answering	—Unverified
How to Build an AI Tutor That Can Adapt to Any Course Using Knowledge Graph-Enhanced Retrieval-Augmented Generation (KG-RAG)	Nov 29, 2023	HallucinationKnowledge Graphs	—Unverified
MHQA: A Diverse, Knowledge Intensive Mental Health Question Answering Challenge for Language Models	Feb 21, 2025	BenchmarkingDiagnostic	—Unverified
Book Review: Interactive Multi-Modal Question-Answering by Antal van den Bosch and Gosse Bouma	Jan 1, 2012	Dialogue ManagementQuestion Answering	—Unverified
MIA 2022 Shared Task: Evaluating Cross-lingual Open-Retrieval Question Answering for 16 Diverse Languages	Jul 2, 2022	Question AnsweringRetrieval	—Unverified
MIA 2022 Shared Task Submission: Leveraging Entity Representations, Dense-Sparse Hybrids, and Fusion-in-Decoder for Cross-Lingual Question Answering	Jul 5, 2022	Cross-Lingual Question AnsweringDecoder	—Unverified
Continual Learning for Temporal-Sensitive Question Answering	Jul 17, 2024	Continual LearningContrastive Learning	—Unverified
Efficient Models for the Detection of Hate, Abuse and Profanity	Feb 8, 2024	Document Classificationnamed-entity-recognition	—Unverified
MICRON: Multigranular Interaction for Contextualizing RepresentatiON in Non-factoid Question Answering	Nov 1, 2019	Information RetrievalQuestion Answering	—Unverified
Microsoft AI Challenge India 2018: Learning to Rank Passages for Web Question Answering with Deep Attention Networks	Jun 14, 2019	Deep AttentionLearning-To-Rank	—Unverified
Model Tailor: Mitigating Catastrophic Forgetting in Multi-modal Large Language Models	Feb 19, 2024	Image CaptioningQuestion Answering	—Unverified
How Susceptible are LLMs to Influence in Prompts?	Aug 17, 2024	Multiple-choiceQuestion Answering	—Unverified
Miko Team: Deep Learning Approach for Legal Question Answering in ALQAC 2022	Nov 4, 2022	Information RetrievalQuestion Answering	—Unverified
Mildly Non-Projective Dependency Grammar	Jan 1, 2013	Machine TranslationQuestion Answering	—Unverified
How State-Of-The-Art Models Can Deal With Long-Form Question Answering	Oct 1, 2020	FormLong Form Question Answering	—Unverified
Continual Domain Adaptation for Machine Reading Comprehension	Aug 25, 2020	Continual LearningDomain Adaptation	—Unverified
How Stable is Knowledge Base Knowledge?	Nov 2, 2022	Question Answering	—Unverified
MIMOQA: Multimodal Input Multimodal Output Question Answering	Jun 1, 2021	Question AnsweringVisual Question Answering	—Unverified
How Self-Attention Improves Rare Class Performance in a Question-Answering Dialogue Agent	Jul 1, 2020	Language ModelingLanguage Modelling	—Unverified
Mindful-RAG: A Study of Points of Failure in Retrieval Augmented Generation	Jul 16, 2024	Knowledge GraphsQuestion Answering	—Unverified
A Multithreaded Conversational Interface for Pedestrian Navigation and Question Answering	Aug 1, 2013	Question AnsweringSpoken Dialogue Systems	—Unverified
Accounting for Sycophancy in Language Model Uncertainty Estimation	Oct 17, 2024	Language ModelingLanguage Modelling	—Unverified
Modern Question Answering Datasets and Benchmarks: A Survey	Jun 30, 2022	Deep LearningQuestion Answering	—Unverified
Contingency and Comparison Relation Labeling and Structure Prediction in Chinese Sentences	Jul 1, 2012	Opinion MiningQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 126 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified