Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1701–1725 of 10817 papers

Title	Date	Tasks	Status	Hype	Score
Can AI-Generated Text be Reliably Detected?	Mar 17, 2023	Language ModellingLarge Language Model	CodeCode Available	1	5
Coarse-to-Fine Vision-Language Pre-training with Fusion in the Backbone	Jun 15, 2022	Described Object DetectionImage Captioning	CodeCode Available	1	5
Coarse-to-Fine Reasoning for Visual Question Answering	Oct 6, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1	5
Can an AI Win Ghana's National Science and Maths Quiz? An AI Grand Challenge for Education	Jan 30, 2023	MathPosition	CodeCode Available	1	5
QAConv: Question Answering on Informative Conversations	May 14, 2021	Question Answering	CodeCode Available	1	5
CogMG: Collaborative Augmentation Between Large Language Model and Knowledge Graph	Jun 25, 2024	Knowledge Graph CompletionKnowledge Graphs	CodeCode Available	1	5
A Survey of Medical Vision-and-Language Applications and Their Techniques	Nov 19, 2024	Decision MakingDiagnostic	CodeCode Available	1	5
Generating with Confidence: Uncertainty Quantification for Black-box Large Language Models	May 30, 2023	ManagementQuestion Answering	CodeCode Available	1	5
APOLLO: An Optimized Training Approach for Long-form Numerical Reasoning	Dec 14, 2022	Conversational Question AnsweringDiversity	CodeCode Available	1	5
QALD-9-plus: A Multilingual Dataset for Question Answering over DBpedia and Wikidata Translated by Native Speakers	Jan 31, 2022	Graph Question AnsweringQuestion Answering	CodeCode Available	1	5
CAT-ViL: Co-Attention Gated Vision-Language Embedding for Visual Question Localized-Answering in Robotic Surgery	Jul 11, 2023	Question AnsweringScene Understanding	CodeCode Available	1	5
KITLM: Domain-Specific Knowledge InTegration into Language Models for Question Answering	Aug 7, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder Transformers	Mar 29, 2021	DecoderImage Segmentation	CodeCode Available	1	5
Generator-Retriever-Generator Approach for Open-Domain Question Answering	Jul 21, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Knowledge-Augmented Language Model Verification	Oct 19, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
KGLM: Integrating Knowledge Graph Structure in Language Models for Link Prediction	Nov 4, 2022	Fraud DetectionKnowledge Graph Completion	CodeCode Available	1	5
KG-Retriever: Efficient Knowledge Indexing for Retrieval-Augmented Large Language Models	Dec 7, 2024	Multi-hop Question AnsweringNavigate	CodeCode Available	1	5
Can Generative Pre-trained Language Models Serve as Knowledge Bases for Closed-book QA?	Jun 3, 2021	Question Answering	CodeCode Available	1	5
Clues Before Answers: Generation-Enhanced Multiple-Choice QA	Apr 30, 2022	DecoderMultiple-choice	CodeCode Available	1	5
Can I Trust Your Answer? Visually Grounded Video Question Answering	Sep 4, 2023	Grounded Video Question AnsweringQuestion Answering	CodeCode Available	1	5
Kformer: Knowledge Injection in Transformer Feed-Forward Layers	Jan 15, 2022	Language ModellingMedical Question Answering	CodeCode Available	1	5
KGE-CL: Contrastive Learning of Tensor Decomposition Based Knowledge Graph Embeddings	Dec 9, 2021	Contrastive LearningGraph Embedding	CodeCode Available	1	5
Glance and Focus: Memory Prompting for Multi-Event Video Question Answering	Jan 3, 2024	Action DetectionHuman-Object Interaction Detection	CodeCode Available	1	5
Can Language Models Solve Graph Problems in Natural Language?	May 17, 2023	In-Context LearningKnowledge Probing	CodeCode Available	1	5
KILT: a Benchmark for Knowledge Intensive Language Tasks	Sep 4, 2020	Entity LinkingFact Checking	CodeCode Available	1	5

Show:10 25 50

← PrevPage 69 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified