Image Description

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 154 papers

Title	Date	Tasks	Status	Score
Human Attention in Image Captioning: Dataset and Analysis	Mar 6, 2019	Image CaptioningImage Description	CodeCode Available	5
Compositional Obverter Communication Learning From Raw Visual Input	Apr 6, 2018	Image Description	CodeCode Available	5
Pragmatic factors in image description: the case of negations	Jun 20, 2016	Image DescriptionNegation	CodeCode Available	5
Multimodal Word Sense Disambiguation in Creative Practice	Jul 15, 2020	ClassificationDescriptive	CodeCode Available	5
Contextualize, Show and Tell: A Neural Visual Storyteller	Jun 3, 2018	DecoderImage Description	CodeCode Available	5
On Architectures for Including Visual Information in Neural Language Models for Image Description	Nov 9, 2019	Image DescriptionLanguage Modeling	CodeCode Available	5
CIDEr-R: Robust Consensus-based Image Description Evaluation	Sep 28, 2021	DescriptiveImage Description	CodeCode Available	5
Multi30K: Multilingual English-German Image Descriptions	May 2, 2016	Image DescriptionMachine Translation	CodeCode Available	5
Multilingual Image Description with Neural Sequence Models	Oct 15, 2015	Image CaptioningImage Description	CodeCode Available	5
Room for improvement in automatic image description: an error analysis	Apr 13, 2017	Image Description	CodeCode Available	5
Measuring the Diversity of Automatic Image Descriptions	Aug 1, 2018	DiversityImage Description	CodeCode Available	5
MAGID: An Automated Pipeline for Generating Synthetic Multi-modal Datasets	Mar 5, 2024	DiversityImage Description	CodeCode Available	5
MiCEval: Unveiling Multimodal Chain of Thought's Quality via Image Description and Reasoning Steps	Oct 18, 2024	Image DescriptionInformativeness	CodeCode Available	5
Localized Symbolic Knowledge Distillation for Visual Commonsense Models	Dec 8, 2023	Image DescriptionInstruction Following	CodeCode Available	5
Long-term Recurrent Convolutional Networks for Visual Recognition and Description	Nov 17, 2014	Image DescriptionRetrieval	CodeCode Available	5
Describing Videos by Exploiting Temporal Structure	Feb 27, 2015	Action RecognitionImage Description	CodeCode Available	5
Bridging Languages through Images with Deep Partial Canonical Correlation Analysis	Jul 1, 2018	Image DescriptionImage Retrieval	CodeCode Available	5
Improving Visual-Semantic Embeddings by Learning Semantically-Enhanced Hard Negatives for Cross-modal Information Retrieval	Oct 10, 2022	Cross-Modal Information RetrievalImage Description	CodeCode Available	5
Difficult Task Yes but Simple Task No: Unveiling the Laziness in Multimodal LLMs	Oct 15, 2024	Image DescriptionMultiple-choice	CodeCode Available	5
Deep Imbalanced Attribute Classification using Visual Attention Aggregation	Jul 10, 2018	AttributeClassification	CodeCode Available	5
Does Multimodality Help Human and Machine for Translation and Image Captioning?	May 30, 2016	Image CaptioningImage Description	CodeCode Available	5
Bounding and Filling: A Fast and Flexible Framework for Image Captioning	Oct 15, 2023	Image CaptioningImage Description	CodeCode Available	5
IDEA: Image Description Enhanced CLIP-Adapter	Jan 15, 2025	Few-Shot Image Classificationimage-classification	CodeCode Available	5
Efficient Decentralized Visual Place Recognition From Full-Image Descriptors	May 30, 2017	ClusteringImage Description	CodeCode Available	5
Generating Image Descriptions via Sequential Cross-Modal Alignment Guided by Human Gaze	Nov 9, 2020	cross-modal alignmentImage Captioning	CodeCode Available	5

Show:10 25 50

← PrevPage 2 of 7Next →

No leaderboard results yet.