Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3451–3475 of 10817 papers

Title	Date	Tasks	Status	Score
Audiopedia: Audio QA with Knowledge	Dec 29, 2024	Audio Question AnsweringEntity Linking	CodeCode Available	5
Interactive Machine Comprehension with Information Seeking Agents	Aug 27, 2019	Decision MakingInformation Retrieval	CodeCode Available	5
Interactive Instance-based Evaluation of Knowledge Base Question Answering	Nov 1, 2018	Entity LinkingKnowledge Base Question Answering	CodeCode Available	5
CROPE: Evaluating In-Context Adaptation of Vision and Language Models to Culture-Specific Concepts	Oct 20, 2024	Question AnsweringVisual Question Answering	CodeCode Available	5
Intelligent Assistant for People with Low Vision Abilities	Nov 20, 2017	Question Answering	CodeCode Available	5
Intent Classification in Question-Answering Using LSTM Architectures	Jan 25, 2020	ClassificationGeneral Classification	CodeCode Available	5
Interactive Natural Language-based Person Search	Feb 19, 2020	Person SearchQuestion Answering	CodeCode Available	5
ISCAS at SemEval-2020 Task 5: Pre-trained Transformers for Counterfactual Statement Modeling	Sep 17, 2020	counterfactualQuestion Answering	CodeCode Available	5
CRiskEval: A Chinese Multi-Level Risk Evaluation Benchmark Dataset for Large Language Models	Jun 7, 2024	Multiple-choicePhilosophy	CodeCode Available	5
CRIPP-VQA: Counterfactual Reasoning about Implicit Physical Properties via Video Question Answering	Nov 7, 2022	Add - POAdd - PQ	CodeCode Available	5
Injecting Numerical Reasoning Skills into Knowledge Base Question Answering Models	Dec 12, 2021	Data AugmentationKnowledge Base Question Answering	CodeCode Available	5
Evaluating Fairness in Large Vision-Language Models Across Diverse Demographic Attributes and Prompts	Jun 25, 2024	FairnessQuestion Answering	CodeCode Available	5
Crake: Causal-Enhanced Table-Filler for Question Answering over Large Scale Knowledge Base	Jul 8, 2022	Question AnsweringRelation Extraction	CodeCode Available	5
Representation Learning for Answer Selection with LSTM-Based Importance Weighting	Jan 1, 2017	Answer SelectionCommunity Question Answering	CodeCode Available	5
Attribute Diversity Determines the Systematicity Gap in VQA	Nov 15, 2023	AttributeDiagnostic	CodeCode Available	5
Analyzing Vietnamese Legal Questions Using Deep Neural Networks with Biaffine Classifiers	Apr 27, 2023	Dependency ParsingPOS	CodeCode Available	5
Instruction Makes a Difference	Feb 1, 2024	HallucinationInstruction Following	CodeCode Available	5
Attributed and Predictive Entity Embedding for Fine-Grained Entity Typing in Knowledge Bases	Aug 1, 2018	Entity LinkingEntity Typing	CodeCode Available	5
Inexpensive Domain Adaptation of Pretrained Language Models: Case Studies on Biomedical NER and Covid-19 QA	Apr 7, 2020	Domain Adaptationnamed-entity-recognition	CodeCode Available	5
Evaluating Large Language Models in Semantic Parsing for Conversational Question Answering over Knowledge Graphs	Jan 3, 2024	Conversational Question AnsweringInformation Retrieval	CodeCode Available	5
Crafting In-context Examples according to LMs' Parametric Knowledge	Nov 16, 2023	HallucinationIn-Context Learning	CodeCode Available	5
AttenWalker: Unsupervised Long-Document Question Answering via Attention-based Graph Walking	May 3, 2023	Few-Shot LearningQuestion Answering	CodeCode Available	5
A Discrete Hard EM Approach for Weakly Supervised Question Answering	Sep 11, 2019	Question AnsweringTriviaQA	CodeCode Available	5
Inferring Implicit Relations in Complex Questions with Language Models	Apr 28, 2022	Implicit RelationsQuestion Answering	CodeCode Available	5
Attentive Pooling Networks	Feb 11, 2016	Answer SelectionQuestion Answering	CodeCode Available	5

Show:10 25 50

← PrevPage 139 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified