Image Description

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 154 papers

Title	Date	Tasks	Status
Compositional Obverter Communication Learning From Raw Visual Input	Apr 6, 2018	Image Description	CodeCode Available
Efficient Decentralized Visual Place Recognition From Full-Image Descriptors	May 30, 2017	ClusteringImage Description	CodeCode Available
Talking about other people: an endless range of possibilities	Nov 1, 2018	Image DescriptionText Generation	CodeCode Available
Human Attention in Image Captioning: Dataset and Analysis	Mar 6, 2019	Image CaptioningImage Description	CodeCode Available
Unsupervised Visual Sense Disambiguation for Verbs using Multimodal Embeddings	Mar 30, 2016	Image DescriptionImage Retrieval	CodeCode Available
CIDEr-R: Robust Consensus-based Image Description Evaluation	Sep 28, 2021	DescriptiveImage Description	CodeCode Available
Pragmatic factors in image description: the case of negations	Jun 20, 2016	Image DescriptionNegation	CodeCode Available
Large Language Models can Share Images, Too!	Oct 23, 2023	Image DescriptionSentence	CodeCode Available
Cross-linguistic differences and similarities in image descriptions	Jul 6, 2017	Image DescriptionSpecificity	CodeCode Available
Varying image description tasks: spoken versus written descriptions	Aug 1, 2018	Image Description	CodeCode Available
Localized Symbolic Knowledge Distillation for Visual Commonsense Models	Dec 8, 2023	Image DescriptionInstruction Following	CodeCode Available
Long-term Recurrent Convolutional Networks for Visual Recognition and Description	Nov 17, 2014	Image DescriptionRetrieval	CodeCode Available
Improving Visual-Semantic Embeddings by Learning Semantically-Enhanced Hard Negatives for Cross-modal Information Retrieval	Oct 10, 2022	Cross-Modal Information RetrievalImage Description	CodeCode Available
MAGID: An Automated Pipeline for Generating Synthetic Multi-modal Datasets	Mar 5, 2024	DiversityImage Description	CodeCode Available
Measuring the Diversity of Automatic Image Descriptions	Aug 1, 2018	DiversityImage Description	CodeCode Available
MiCEval: Unveiling Multimodal Chain of Thought's Quality via Image Description and Reasoning Steps	Oct 18, 2024	Image DescriptionInformativeness	CodeCode Available
What a neural language model tells us about spatial relations	Jun 1, 2019	Image DescriptionLanguage Modeling	CodeCode Available
Does Multimodality Help Human and Machine for Translation and Image Captioning?	May 30, 2016	Image CaptioningImage Description	CodeCode Available
Difficult Task Yes but Simple Task No: Unveiling the Laziness in Multimodal LLMs	Oct 15, 2024	Image DescriptionMultiple-choice	CodeCode Available
Describing Videos by Exploiting Temporal Structure	Feb 27, 2015	Action RecognitionImage Description	CodeCode Available
VisBias: Measuring Explicit and Implicit Social Biases in Vision Language Models	Mar 10, 2025	Image DescriptionMultiple-choice	CodeCode Available
Multi30K: Multilingual English-German Image Descriptions	May 2, 2016	Image DescriptionMachine Translation	CodeCode Available
Contextualize, Show and Tell: A Neural Visual Storyteller	Jun 3, 2018	DecoderImage Description	CodeCode Available
Multilingual Image Description with Neural Sequence Models	Oct 15, 2015	Image CaptioningImage Description	CodeCode Available
Room for improvement in automatic image description: an error analysis	Apr 13, 2017	Image Description	CodeCode Available

Show:10 25 50

← PrevPage 6 of 7Next →

No leaderboard results yet.