Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9926–9950 of 10817 papers

Title	Date	Tasks	Status
Evidence-Focused Fact Summarization for Knowledge-Augmented Zero-Shot Question Answering	Mar 5, 2024	FormKnowledge Graphs	CodeCode Available
Limited Ability of LLMs to Simulate Human Psychological Behaviours: a Psychometric Analysis	May 12, 2024	Multiple-choiceQuestion Answering	CodeCode Available
Neuro-Symbolic Visual Dialog	Aug 22, 2022	Question Answering	CodeCode Available
Pretraining Vision-Language Model for Difference Visual Question Answering in Longitudinal Chest X-rays	Feb 14, 2024	Language ModelingLanguage Modelling	CodeCode Available
Evidence Aggregation for Answer Re-Ranking in Open-Domain Question Answering	Nov 14, 2017	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
AQUALLM: Audio Question Answering Data Generation Using Large Language Models	Dec 28, 2023	Audio Question AnsweringQuestion Answering	CodeCode Available
Event Knowledge Incorporation with Posterior Regularization for Event-Centric Question Answering	May 8, 2023	Language ModellingQuestion Answering	CodeCode Available
A Qualitative Comparison of CoQA, SQuAD 2.0 and QuAC	Sep 27, 2018	Question Answering	CodeCode Available
Primacy Effect of ChatGPT	Oct 20, 2023	Natural Language UnderstandingQuestion Answering	CodeCode Available
Co-attending Regions and Detections with Multi-modal Multiplicative Embedding for VQA	Nov 18, 2017	FormQuestion Answering	CodeCode Available
CNN for Text-Based Multiple Choice Question Answering	Jul 1, 2018	Multiple-choiceQuestion Answering	CodeCode Available
Audiopedia: Audio QA with Knowledge	Dec 29, 2024	Audio Question AnsweringEntity Linking	CodeCode Available
CODAH: An Adversarially Authored Question-Answer Dataset for Common Sense	Apr 8, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available
Attribute Diversity Determines the Systematicity Gap in VQA	Nov 15, 2023	AttributeDiagnostic	CodeCode Available
Attributed and Predictive Entity Embedding for Fine-Grained Entity Typing in Knowledge Bases	Aug 1, 2018	Entity LinkingEntity Typing	CodeCode Available
Event Detection as Question Answering with Entity Information	Apr 14, 2021	Event DetectionLanguage Modeling	CodeCode Available
Relation-Aware Question Answering for Heterogeneous Knowledge Graphs	Dec 19, 2023	Knowledge Base Question AnsweringKnowledge Graphs	CodeCode Available
REVEAL: Retrieval-Augmented Visual-Language Pre-Training with Multi-Source Multimodal Knowledge Memory	Dec 10, 2022	Image CaptioningLanguage Modeling	CodeCode Available
Event-Centric Question Answering via Contrastive Learning and Invertible Event Transformation	Oct 24, 2022	Contrastive LearningQuestion Answering	CodeCode Available
LININ: Logic Integrated Neural Inference Network for Explanatory Visual Question Answering	Dec 24, 2024	Explanatory Visual Question AnsweringMultimodal Reasoning	CodeCode Available
NewsQuote: A Dataset Built on Quote Extraction and Attribution for Expert Recommendation in Fact-Checking	May 5, 2023	ArticlesFact Checking	CodeCode Available
Evaluation of Semantic Answer Similarity Metrics	Jun 25, 2022	Machine TranslationQuestion Answering	CodeCode Available
Adding Gradient Noise Improves Learning for Very Deep Networks	Nov 21, 2015	Question Answering	CodeCode Available
CNM: An Interpretable Complex-valued Network for Matching	Apr 10, 2019	BenchmarkingQuestion Answering	CodeCode Available
Evaluating the Elementary Multilingual Capabilities of Large Language Models with MultiQ	Mar 6, 2024	Open-Ended Question AnsweringQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 398 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified