Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4776–4800 of 10817 papers

Title	Date	Tasks	Status	Hype
Is Multimodal Vision Supervision Beneficial to Language?	Feb 10, 2023	Image RetrievalNatural Language Understanding	CodeCode Available	0
Realistic Conversational Question Answering with Answer Selection based on Calibrated Confidence and Uncertainty Measurement	Feb 10, 2023	Answer SelectionConversational Question Answering	CodeCode Available	0
A Biomedical Knowledge Graph for Biomarker Discovery in Cancer	Feb 9, 2023	ArticlesData Integration	—Unverified	0
Explanation Selection Using Unlabeled Data for Chain-of-Thought Prompting	Feb 9, 2023	Mathematical ReasoningNatural Language Inference	CodeCode Available	0
Robust Question Answering against Distribution Shifts with Test-Time Adaptation: An Empirical Study	Feb 9, 2023	Imitation LearningQuestion Answering	CodeCode Available	0
ELBA: Learning by Asking for Embodied Visual Navigation and Task Completion	Feb 9, 2023	Question AnsweringVisual Navigation	—Unverified	0
ChatGPT versus Traditional Question Answering for Knowledge Graphs: Current Status and Future Directions Towards Knowledge Graph Chatbots	Feb 8, 2023	ChatbotKnowledge Graphs	—Unverified	0
Exploring the Benefits of Training Expert Language Models over Instruction Tuning	Feb 7, 2023	Common Sense ReasoningCoreference Resolution	CodeCode Available	1
A Survey on Arabic Named Entity Recognition: Past, Recent Advances, and Future Trends	Feb 7, 2023	Feature EngineeringLanguage Modeling	—Unverified	0
Efficient End-to-End Video Question Answering with Pyramidal Multimodal Transformer	Feb 4, 2023	Computational EfficiencyQuestion Answering	CodeCode Available	0
LaMPP: Language Models as Probabilistic Priors for Perception and Action	Feb 3, 2023	Activity RecognitionDecision Making	CodeCode Available	1
Bioformer: an efficient transformer language model for biomedical text mining	Feb 3, 2023	ArticlesDocument Classification	CodeCode Available	1
LIQUID: A Framework for List Question Answering Dataset Generation	Feb 3, 2023	Dataset GenerationQuestion Answering	CodeCode Available	1
Language Quantized AutoEncoders: Towards Unsupervised Text-Image Alignment	Feb 2, 2023	AttributeFew-Shot Image Classification	CodeCode Available	1
Combining Deep Neural Reranking and Unsupervised Extraction for Multi-Query Focused Summarization	Feb 2, 2023	DiversityExtractive Summarization	—Unverified	0
idT5: Indonesian Version of Multilingual T5 Transformer	Feb 2, 2023	Question AnsweringQuestion Generation	—Unverified	0
Multimodality Representation Learning: A Survey on Evolution, Pretraining and Its Applications	Feb 1, 2023	Question AnsweringRepresentation Learning	CodeCode Available	1
CSAT‑FTCN: A Fuzzy‑Oriented Model with Contextual Self‑attention Network for Multimodal Emotion Recognition	Jan 31, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Faithful Chain-of-Thought Reasoning	Jan 31, 2023	MathMulti-hop Question Answering	CodeCode Available	0
PADL: Language-Directed Physics-Based Character Control	Jan 31, 2023	Image GenerationImitation Learning	CodeCode Available	1
REPLUG: Retrieval-Augmented Black-Box Language Models	Jan 30, 2023	Language ModelingLanguage Modelling	CodeCode Available	3
Can an AI Win Ghana's National Science and Maths Quiz? An AI Grand Challenge for Education	Jan 30, 2023	MathPosition	CodeCode Available	1
HeroNet: A Hybrid Retrieval-Generation Network for Conversational Bots	Jan 29, 2023	Multi-Task LearningQuestion Answering	CodeCode Available	0
MQAG: Multiple-choice Question Answering and Generation for Assessing Information Consistency in Summarization	Jan 28, 2023	HallucinationMultiple-choice	CodeCode Available	2
Semantic Parsing for Conversational Question Answering over Knowledge Graphs	Jan 28, 2023	Conversational Question AnsweringKnowledge Graphs	CodeCode Available	1

Show:10 25 50

← PrevPage 192 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified