Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6251–6275 of 10817 papers

Title	Date	Tasks	Status
How to Evaluate Opinionated Keyphrase Extraction?	Jul 1, 2012	Keyphrase ExtractionMachine Translation	—Unverified
Metaethical Perspectives on 'Benchmarking' AI Ethics	Apr 11, 2022	BenchmarkingEthics	—Unverified
Continually Self-Improving Language Models for Bariatric Surgery Question--Answering	May 22, 2025	Large Language ModelMisinformation	—Unverified
Metaheuristic Approaches to Lexical Substitution and Simplification	Apr 1, 2017	Lexical SimplificationMachine Translation	—Unverified
A Few-Shot Learning Focused Survey on Recent Named Entity Recognition and Relation Classification Methods	Oct 29, 2023	ClassificationFew-Shot Learning	—Unverified
MetaICL: Learning to Learn In Context	Jan 16, 2022	Few-Shot LearningIn-Context Learning	—Unverified
EfficientEQA: An Efficient Approach for Open Vocabulary Embodied Question Answering	Oct 26, 2024	Efficient ExplorationEmbodied Question Answering	—Unverified
A corpus of general and specific sentences from news	May 1, 2012	ArticlesGeneral Classification	—Unverified
Modeling Exemplification in Long-form Question Answering via Retrieval	May 19, 2022	FormLong Form Question Answering	—Unverified
Metamorphic Relation Based Adversarial Attacks on Differentiable Neural Computer	Sep 7, 2018	Question AnsweringRelation	—Unverified
Efficient Global Learning of Entailment Graphs	Jun 1, 2015	Question Answering	—Unverified
Meta-prompting Optimized Retrieval-augmented Generation	Jul 4, 2024	Multi-hop Question AnsweringQuestion Answering	—Unverified
Modeling Multi-hop Question Answering as Single Sequence Prediction	Nov 16, 2021	Answer GenerationDecoder	—Unverified
MetaQA: Combining Expert Agents for Multi-Skill Question Answering	Jan 16, 2022	Question Answering	—Unverified
MetaReflection: Learning Instructions for Language Agents using Past Reflections	May 13, 2024	Logical ReasoningQuestion Answering	—Unverified
MetaToken: Detecting Hallucination in Image Descriptions by Meta Classification	May 29, 2024	HallucinationImage Captioning	—Unverified
A Survey on Recent Advances in Sequence Labeling from Deep Learning Models	Nov 13, 2020	ChunkingGraph Embedding	—Unverified
How to Design Sample and Computationally Efficient VQA Models	Mar 22, 2021	Question AnsweringVisual Question Answering	—Unverified
Method of Tibetan Person Knowledge Extraction	Apr 11, 2016	graph constructionInformation Retrieval	—Unverified
Methods Combination and ML-based Re-ranking of Multiple Hypothesis for Question-Answering Systems	Apr 1, 2012	Information RetrievalQuestion Answering	—Unverified
Modeling Context in Answer Sentence Selection Systems on a Latency Budget	Jan 28, 2021	Machine Reading ComprehensionOpen-Domain Question Answering	—Unverified
How to Build an AI Tutor That Can Adapt to Any Course Using Knowledge Graph-Enhanced Retrieval-Augmented Generation (KG-RAG)	Nov 29, 2023	HallucinationKnowledge Graphs	—Unverified
Continual Learning for Temporal-Sensitive Question Answering	Jul 17, 2024	Continual LearningContrastive Learning	—Unverified
Modeling Coreference Relations in Visual Dialog	Mar 6, 2022	Question AnsweringVisual Dialog	—Unverified
How Susceptible are LLMs to Influence in Prompts?	Aug 17, 2024	Multiple-choiceQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 251 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified