Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9476–9500 of 10817 papers

Title	Date	Tasks	Status
Contextualized Sequence Likelihood: Enhanced Confidence Scores for Natural Language Generation	Jun 3, 2024	Question AnsweringText Generation	CodeCode Available
An Empirical Comparison of Generative Approaches for Product Attribute-Value Identification	Jul 1, 2024	AttributeAttribute Mining	CodeCode Available
Contextual Embeddings for Arabic-English Code-Switched Data	Dec 1, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available
Contextual embedding and model weighting by fusing domain knowledge on Biomedical Question Answering	Jun 26, 2022	Cloze TestMachine Reading Comprehension	CodeCode Available
KOFFVQA: An Objectively Evaluated Free-form VQA Benchmark for Large Vision-Language Models in the Korean Language	Mar 31, 2025	FormQuestion Answering	CodeCode Available
Adaptive Document Retrieval for Deep Question Answering	Aug 20, 2018	Question AnsweringRetrieval	CodeCode Available
An empirical analysis of existing systems and datasets toward general simple question answering	Dec 1, 2020	Natural Language UnderstandingQuestion Answering	CodeCode Available
Konstruktor: A Strong Baseline for Simple Knowledge Graph Question Answering	Sep 24, 2024	Entity LinkingGraph Question Answering	CodeCode Available
Generating Context-Aware Natural Answers for Questions in 3D Scenes	Oct 30, 2023	Question AnsweringSentence	CodeCode Available
Downstream Trade-offs of a Family of Text Watermarks	Nov 16, 2023	FormLanguage Modelling	CodeCode Available
TinyBERT: Distilling BERT for Natural Language Understanding	Sep 23, 2019	Knowledge DistillationLanguage Modelling	CodeCode Available
Adversarial Multi-lingual Neural Relation Extraction	Aug 1, 2018	DiversityQuestion Answering	CodeCode Available
Question Answering on Freebase via Relation Extraction and Textual Evidence	Mar 3, 2016	Question AnsweringRelation	CodeCode Available
Recurrent Batch Normalization	Mar 30, 2016	General ClassificationLanguage Modeling	CodeCode Available
Generalizing Visual Question Answering from Synthetic to Human-Written Questions via a Chain of QA with a Large Language Model	Jan 12, 2024	Language ModelingLanguage Modelling	CodeCode Available
General Greedy De-bias Learning	Dec 20, 2021	image-classificationImage Classification	CodeCode Available
KRAUTS: A German Temporally Annotated News Corpus	May 1, 2018	Information RetrievalQuestion Answering	CodeCode Available
BERTnesia: Investigating the capture and forgetting of knowledge in BERT	Jun 5, 2021	Knowledge Base CompletionLanguage Modeling	CodeCode Available
Ancient Wisdom, Modern Tools: Exploring Retrieval-Augmented LLMs for Ancient Indian Philosophy	Aug 21, 2024	Information RetrievalLong Form Question Answering	CodeCode Available
Contextual Dropout: An Efficient Sample-Dependent Dropout Module	Mar 6, 2021	image-classificationImage Classification	CodeCode Available
Russian Jeopardy! Data Set for Question-Answering Systems	Jun 1, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available
Multimodal Explanations: Justifying Decisions and Pointing to the Evidence	Feb 15, 2018	Activity RecognitionExplainable Models	CodeCode Available
Multi-modal Factorized Bilinear Pooling with Co-Attention Learning for Visual Question Answering	Aug 4, 2017	Question AnsweringVisual Question Answering	CodeCode Available
GeneQuery: A General QA-based Framework for Spatial Gene Expression Predictions from Histology Images	Nov 27, 2024	Question Answeringwhole slide images	CodeCode Available
Context Transformer with Stacked Pointer Networks for Conversational Question Answering over Knowledge Graphs	Mar 13, 2021	Conversational Question AnsweringKnowledge Graphs	CodeCode Available

Show:10 25 50

← PrevPage 380 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified