Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9776–9800 of 10817 papers

Title	Date	Tasks	Status
Automatic Generation of Contrast Sets from Scene Graphs: Probing the Compositional Consistency of GQA	Mar 17, 2021	Question AnsweringRelational Reasoning	CodeCode Available
POSQA: Probe the World Models of LLMs with Size Comparisons	Oct 20, 2023	Question Answering	CodeCode Available
Natural Language Processing: State of The Art, Current Trends and Challenges	Aug 17, 2017	Machine TranslationQuestion Answering	CodeCode Available
Adaptation of Deep Bidirectional Multilingual Transformers for Russian Language	May 17, 2019	Natural Language InferenceParaphrase Identification	CodeCode Available
Powering Comparative Classification with Sentiment Analysis via Domain Adaptive Knowledge Transfer	Sep 7, 2021	Graph Neural NetworkQuestion Answering	CodeCode Available
Learning to Localize Objects Improves Spatial Reasoning in Visual-LLMs	Apr 11, 2024	DescriptiveHallucination	CodeCode Available
Are Large Language Models Really Robust to Word-Level Perturbations?	Sep 20, 2023	DiagnosticQuestion Answering	CodeCode Available
Combining Word Embeddings and Feature Embeddings for Fine-grained Relation Extraction	May 1, 2015	Machine TranslationNER	CodeCode Available
Learning to Model and Ignore Dataset Bias with Mixed Capacity Ensembles	Nov 7, 2020	Natural Language InferenceQuestion Answering	CodeCode Available
Are Large Language Models Good at Utility Judgments?	Mar 28, 2024	Answer GenerationBenchmarking	CodeCode Available
A Recurrent BERT-based Model for Question Generation	Nov 1, 2019	Language ModelingLanguage Modelling	CodeCode Available
Question Dependent Recurrent Entity Network for Question Answering	Jul 25, 2017	FormMemorization	CodeCode Available
PQA: Perceptual Question Answering	Apr 8, 2021	Question Answering	CodeCode Available
PQA: Zero-shot Protein Question Answering for Free-form Scientific Enquiry with Large Language Models	Feb 21, 2024	BenchmarkingForm	CodeCode Available
Analogical Math Word Problems Solving with Enhanced Problem-Solution Association	Dec 1, 2022	MathQuestion Answering	CodeCode Available
Question Directed Graph Attention Network for Numerical Reasoning over Text	Sep 16, 2020	Graph AttentionMachine Reading Comprehension	CodeCode Available
Eyes on the Road: State-of-the-Art Video Question Answering Models Assessment for Traffic Monitoring Tasks	Dec 2, 2024	Multi-Object TrackingObject Tracking	CodeCode Available
Few-shot Transfer Learning for Knowledge Base Question Answering: Fusing Supervised Models with In-Context Learning	Nov 15, 2023	In-Context LearningKnowledge Base Question Answering	CodeCode Available
Extrinsic Evaluation of Cultural Competence in Large Language Models	Jun 17, 2024	Open-Ended Question AnsweringQuestion Answering	CodeCode Available
Extractive Summarization with SWAP-NET: Sentences and Words from Alternating Pointer Networks	Jul 1, 2018	Abstractive Text SummarizationDocument Summarization	CodeCode Available
Reinforced Dynamic Reasoning for Conversational Question Generation	Jul 29, 2019	DecoderQuestion Answering	CodeCode Available
A Question-Focused Multi-Factor Attention Network for Question Answering	Jan 25, 2018	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
Learning to Rank Query Graphs for Complex Question Answering over Knowledge Graphs	Nov 2, 2018	Graph RankingKnowledge Graphs	CodeCode Available
Extracting Victim Counts from Text	Feb 23, 2023	Dependency ParsingHumanitarian	CodeCode Available
Question Embeddings Based on Shannon Entropy: Solving intent classification task in goal-oriented dialogue system	Mar 25, 2019	General Classificationintent-classification	CodeCode Available

Show:10 25 50

← PrevPage 392 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified