Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4751–4800 of 10817 papers

Title	Date	Tasks	Status	Hype
ChatIE: Zero-Shot Information Extraction via Chatting with ChatGPT	Feb 20, 2023	Event Extractionnamed-entity-recognition	CodeCode Available	2
STOA-VLP: Spatial-Temporal Modeling of Object and Action for Video-Language Pre-training	Feb 20, 2023	Language ModellingObject	—Unverified	0
Few-shot Multimodal Multitask Multilingual Learning	Feb 19, 2023	Few-Shot LearningIn-Context Learning	—Unverified	0
Can ChatGPT Understand Too? A Comparative Study on ChatGPT and Fine-tuned BERT	Feb 19, 2023	Question AnsweringSentiment Analysis	CodeCode Available	1
Interpretable Medical Image Visual Question Answering via Multi-Modal Relationship Graph Learning	Feb 19, 2023	Graph LearningMedical Visual Question Answering	—Unverified	0
Semantic Uncertainty: Linguistic Invariances for Uncertainty Estimation in Natural Language Generation	Feb 19, 2023	Question AnsweringText Generation	CodeCode Available	1
Bag of Tricks for Effective Language Model Pretraining and Downstream Adaptation: A Case Study on GLUE	Feb 18, 2023	Contrastive LearningDenoising	—Unverified	0
Bridge Damage Cause Estimation Using Multiple Images Based on Visual Question Answering	Feb 18, 2023	Question AnsweringVisual Question Answering	—Unverified	0
Multimodal Federated Learning via Contrastive Representation Ensemble	Feb 17, 2023	Federated LearningImage-text Retrieval	CodeCode Available	1
Towards Unifying Medical Vision-and-Language Pre-training via Soft Prompts	Feb 17, 2023	Image RetrievalImage-text Classification	CodeCode Available	1
Complex QA and language models hybrid architectures, Survey	Feb 17, 2023	Domain AdaptationFairness	—Unverified	0
Bridge the Gap between Language models and Tabular Understanding	Feb 16, 2023	Contrastive LearningLanguage Modeling	—Unverified	0
Foundation Models for Natural Language Processing -- Pre-trained Language Models Integrating Media	Feb 16, 2023	Question AnsweringStory Generation	—Unverified	0
Product Question Answering in E-Commerce: A Survey	Feb 16, 2023	Question AnsweringSurvey	—Unverified	0
Learning to Initialize: Can Meta Learning Improve Cross-task Generalization in Prompt Tuning?	Feb 16, 2023	Few-Shot LearningLanguage Modeling	—Unverified	0
Effects of Locality and Rule Language on Explanations for Knowledge Graph Embeddings	Feb 14, 2023	Knowledge Graph EmbeddingsKnowledge Graphs	—Unverified	0
Large-Scale Knowledge Synthesis and Complex Information Retrieval from Biomedical Documents	Feb 14, 2023	Information RetrievalKnowledge Graphs	—Unverified	0
Using Artificial Intelligence to aid Scientific Discovery of Climate Tipping Points	Feb 14, 2023	Question Answeringscientific discovery	—Unverified	0
STREET: A Multi-Task Structured Reasoning and Explanation Benchmark	Feb 13, 2023	Question Answering	—Unverified	0
Analyzing the Effectiveness of the Underlying Reasoning Tasks in Multi-hop Question Answering	Feb 12, 2023	Multi-hop Question AnsweringOpen-Ended Question Answering	CodeCode Available	1
Differentiable Outlier Detection Enable Robust Deep Multimodal Analysis	Feb 11, 2023	Image-text RetrievalKnowledge Graphs	CodeCode Available	0
Informing clinical assessment by contextualizing post-hoc explanations of risk prediction models in type-2 diabetes	Feb 11, 2023	Question Answering	—Unverified	0
Compositional Exemplars for In-context Learning	Feb 11, 2023	Code GenerationContrastive Learning	CodeCode Available	1
Alloprof: a new French question-answer education dataset and its use in an information retrieval case study	Feb 10, 2023	Information RetrievalQuestion Answering	CodeCode Available	0
ControversialQA: Exploring Controversy in Question Answering	Feb 10, 2023	Question Answering	—Unverified	0
Is Multimodal Vision Supervision Beneficial to Language?	Feb 10, 2023	Image RetrievalNatural Language Understanding	CodeCode Available	0
Realistic Conversational Question Answering with Answer Selection based on Calibrated Confidence and Uncertainty Measurement	Feb 10, 2023	Answer SelectionConversational Question Answering	CodeCode Available	0
A Biomedical Knowledge Graph for Biomarker Discovery in Cancer	Feb 9, 2023	ArticlesData Integration	—Unverified	0
Explanation Selection Using Unlabeled Data for Chain-of-Thought Prompting	Feb 9, 2023	Mathematical ReasoningNatural Language Inference	CodeCode Available	0
Robust Question Answering against Distribution Shifts with Test-Time Adaptation: An Empirical Study	Feb 9, 2023	Imitation LearningQuestion Answering	CodeCode Available	0
ELBA: Learning by Asking for Embodied Visual Navigation and Task Completion	Feb 9, 2023	Question AnsweringVisual Navigation	—Unverified	0
ChatGPT versus Traditional Question Answering for Knowledge Graphs: Current Status and Future Directions Towards Knowledge Graph Chatbots	Feb 8, 2023	ChatbotKnowledge Graphs	—Unverified	0
Exploring the Benefits of Training Expert Language Models over Instruction Tuning	Feb 7, 2023	Common Sense ReasoningCoreference Resolution	CodeCode Available	1
A Survey on Arabic Named Entity Recognition: Past, Recent Advances, and Future Trends	Feb 7, 2023	Feature EngineeringLanguage Modeling	—Unverified	0
Efficient End-to-End Video Question Answering with Pyramidal Multimodal Transformer	Feb 4, 2023	Computational EfficiencyQuestion Answering	CodeCode Available	0
LaMPP: Language Models as Probabilistic Priors for Perception and Action	Feb 3, 2023	Activity RecognitionDecision Making	CodeCode Available	1
Bioformer: an efficient transformer language model for biomedical text mining	Feb 3, 2023	ArticlesDocument Classification	CodeCode Available	1
LIQUID: A Framework for List Question Answering Dataset Generation	Feb 3, 2023	Dataset GenerationQuestion Answering	CodeCode Available	1
Language Quantized AutoEncoders: Towards Unsupervised Text-Image Alignment	Feb 2, 2023	AttributeFew-Shot Image Classification	CodeCode Available	1
Combining Deep Neural Reranking and Unsupervised Extraction for Multi-Query Focused Summarization	Feb 2, 2023	DiversityExtractive Summarization	—Unverified	0
idT5: Indonesian Version of Multilingual T5 Transformer	Feb 2, 2023	Question AnsweringQuestion Generation	—Unverified	0
Multimodality Representation Learning: A Survey on Evolution, Pretraining and Its Applications	Feb 1, 2023	Question AnsweringRepresentation Learning	CodeCode Available	1
CSAT‑FTCN: A Fuzzy‑Oriented Model with Contextual Self‑attention Network for Multimodal Emotion Recognition	Jan 31, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Faithful Chain-of-Thought Reasoning	Jan 31, 2023	MathMulti-hop Question Answering	CodeCode Available	0
PADL: Language-Directed Physics-Based Character Control	Jan 31, 2023	Image GenerationImitation Learning	CodeCode Available	1
REPLUG: Retrieval-Augmented Black-Box Language Models	Jan 30, 2023	Language ModelingLanguage Modelling	CodeCode Available	3
Can an AI Win Ghana's National Science and Maths Quiz? An AI Grand Challenge for Education	Jan 30, 2023	MathPosition	CodeCode Available	1
HeroNet: A Hybrid Retrieval-Generation Network for Conversational Bots	Jan 29, 2023	Multi-Task LearningQuestion Answering	CodeCode Available	0
MQAG: Multiple-choice Question Answering and Generation for Assessing Information Consistency in Summarization	Jan 28, 2023	HallucinationMultiple-choice	CodeCode Available	2
Semantic Parsing for Conversational Question Answering over Knowledge Graphs	Jan 28, 2023	Conversational Question AnsweringKnowledge Graphs	CodeCode Available	1

Show:10 25 50

← PrevPage 96 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified