Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1275 of 10817 papers

Title	Date	Tasks	Status	Hype
Baby's CoThought: Leveraging Large Language Models for Enhanced Reasoning in Compact Models	Aug 3, 2023	In-Context LearningNatural Language Understanding	CodeCode Available	1
ADEM-VL: Adaptive and Embedded Fusion for Efficient Vision-Language Tuning	Oct 23, 2024	Image CaptioningInstruction Following	CodeCode Available	1
Differentiable Reasoning on Large Knowledge Bases and Natural Language	Dec 17, 2019	Link PredictionQuestion Answering	CodeCode Available	1
Encoding and Controlling Global Semantics for Long-form Video Question Answering	May 30, 2024	FormQuestion Answering	CodeCode Available	1
End-to-End Training of Neural Retrievers for Open-Domain Question Answering	Jan 2, 2021	Natural QuestionsOpen-Domain Question Answering	CodeCode Available	1
Engineering flexible machine learning systems by traversing functionally-invariant paths	Apr 30, 2022	Adversarial RobustnessContinual Learning	CodeCode Available	1
Discourse Analysis via Questions and Answers: Parsing Dependency Structures of Questions Under Discussion	Oct 12, 2022	Dependency ParsingQuestion Answering	CodeCode Available	1
Enhancing Complex Question Answering over Knowledge Graphs through Evidence Pattern Retrieval	Feb 3, 2024	Information RetrievalKnowledge Graphs	CodeCode Available	1
Divide and Conquer: Text Semantic Matching with Disentangled Keywords and Intents	Mar 6, 2022	Community Question AnsweringInformation Retrieval	CodeCode Available	1
Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation	Jan 6, 2025	Language Model EvaluationLanguage Modeling	CodeCode Available	1
Enhancing Multi-modal and Multi-hop Question Answering via Structured Knowledge and Unified Retrieval-Generation	Dec 16, 2022	Answer GenerationDecoder	CodeCode Available	1
Enhancing Table Recognition with Vision LLMs: A Benchmark and Neighbor-Guided Toolchain Reasoner	Dec 30, 2024	Question AnsweringTable Recognition	CodeCode Available	1
DyGKT: Dynamic Graph Learning for Knowledge Tracing	Jul 30, 2024	Graph LearningKnowledge Tracing	CodeCode Available	1
Entailment Tree Explanations via Iterative Retrieval-Generation Reasoner	May 18, 2022	DecoderQuestion Answering	CodeCode Available	1
Entity-Enriched Neural Models for Clinical Question Answering	May 13, 2020	Question Answering	CodeCode Available	1
EntQA: Entity Linking as Question Answering	Oct 5, 2021	BenchmarkingEntity Linking	CodeCode Available	1
Attention-Based Context Aware Reasoning for Situation Recognition	Jun 1, 2020	Action RecognitionFine-grained Action Recognition	CodeCode Available	1
ERICA: Improving Entity and Relation Understanding for Pre-trained Language Models via Contrastive Learning	Dec 30, 2020	Contrastive LearningEntity Typing	CodeCode Available	1
Detecting Hate Speech in Multi-modal Memes	Dec 29, 2020	Binary ClassificationHate Speech Detection	CodeCode Available	1
Automatically Generating Cause-and-Effect Questions from Passages	Apr 1, 2021	Question AnsweringQuestion Generation	CodeCode Available	1
Development and bilingual evaluation of Japanese medical large language model within reasonably low computational resources	Sep 18, 2024	GPULanguage Modeling	CodeCode Available	1
Detecting and Preventing Hallucinations in Large Vision Language Models	Aug 11, 2023	16kHallucination	CodeCode Available	1
An Efficient Memory-Augmented Transformer for Knowledge-Intensive NLP Tasks	Oct 30, 2022	Computational EfficiencyQuestion Answering	CodeCode Available	1
Ethics Sheets for AI Tasks	Jul 2, 2021	ArticlesEmotion Recognition	CodeCode Available	1
DeVLBert: Learning Deconfounded Visio-Linguistic Representations	Aug 16, 2020	Image RetrievalQuestion Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 51 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified