Image Description

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 154 papers

Title	Date	Tasks	Status
WIDIn: Wording Image for Domain-Invariant Representation in Single-Source Domain Generalization	May 28, 2024	Domain GeneralizationImage Description	—Unverified
Zero-Resource Neural Machine Translation with Multi-Agent Communication Game	Feb 9, 2018	DecoderImage Captioning	—Unverified
Focused Evaluation for Image Description with Binary Forced-Choice Tasks	Aug 1, 2016	Image CaptioningImage Description	—Unverified
From phonemes to images: levels of representation in a recurrent neural model of visually-grounded language learning	Oct 11, 2016	FormGrounded language learning	—Unverified
Generating Image Captions in Arabic using Root-Word Based Recurrent Neural Networks and Deep Neural Networks	Jun 1, 2018	Caption GenerationImage Captioning	—Unverified
Hausa Visual Genome: A Dataset for Multi-Modal English to Hausa Machine Translation	May 2, 2022	Image DescriptionMachine Translation	—Unverified
Im2Text: Describing Images Using 1 Million Captioned Photographs	Dec 1, 2011	Image CaptioningImage Description	—Unverified
Image Description Dataset for Language Learners	Jun 1, 2022	Image DescriptionSentence	—Unverified
Image Description using Visual Dependency Representations	Oct 1, 2013	Image DescriptionImage Retrieval	—Unverified
Image Pivoting for Learning Multilingual Multimodal Representations	Jul 24, 2017	Image DescriptionImage Retrieval	—Unverified
Impressions: Understanding Visual Semiotics and Aesthetic Impact	Oct 27, 2023	Image CaptioningImage Description	—Unverified
Improving Description-based Person Re-identification by Multi-granularity Image-text Alignments	Jun 23, 2019	Image DescriptionPerson Re-Identification	—Unverified
InfoVisDial: An Informative Visual Dialogue Dataset by Bridging Large Multimodal and Language Models	Dec 21, 2023	Image Description	—Unverified
Fan-Beam Binarization Difference Projection (FB-BDP): A Novel Local Object Descriptor for Fine-Grained Leaf Image Retrieval	Jan 1, 2023	BinarizationImage Description	CodeCode Available
The Treasure beneath Convolutional Layers: Cross-convolutional-layer Pooling for Image Classification	Nov 27, 2014	General Classificationimage-classification	CodeCode Available
On Architectures for Including Visual Information in Neural Language Models for Image Description	Nov 9, 2019	Image DescriptionLanguage Modeling	CodeCode Available
Bridging Languages through Images with Deep Partial Canonical Correlation Analysis	Jul 1, 2018	Image DescriptionImage Retrieval	CodeCode Available
Generating Image Descriptions via Sequential Cross-Modal Alignment Guided by Human Gaze	Nov 9, 2020	cross-modal alignmentImage Captioning	CodeCode Available
Face2Text: Collecting an Annotated Image Description Corpus for the Generation of Rich Face Descriptions	Mar 10, 2018	Image DescriptionImage to text	CodeCode Available
Beyond Part Models: Person Retrieval with Refined Part Pooling (and a Strong Convolutional Baseline)	Nov 26, 2017	Image DescriptionPerson Re-Identification	CodeCode Available
How Do Image Description Systems Describe People? A Targeted Assessment of System Competence in the PEOPLE-domain	Dec 1, 2020	Image Description	CodeCode Available
IDEA: Image Description Enhanced CLIP-Adapter	Jan 15, 2025	Few-Shot Image Classificationimage-classification	CodeCode Available
Deep Imbalanced Attribute Classification using Visual Attention Aggregation	Jul 10, 2018	AttributeClassification	CodeCode Available
Skeletal Human Action Recognition using Hybrid Attention based Graph Convolutional Network	Jul 12, 2022	Action RecognitionImage Description	CodeCode Available
Unsupervised Image Captioning	Nov 27, 2018	Image CaptioningImage Description	CodeCode Available
Compositional Obverter Communication Learning From Raw Visual Input	Apr 6, 2018	Image Description	CodeCode Available
Efficient Decentralized Visual Place Recognition From Full-Image Descriptors	May 30, 2017	ClusteringImage Description	CodeCode Available
Talking about other people: an endless range of possibilities	Nov 1, 2018	Image DescriptionText Generation	CodeCode Available
Human Attention in Image Captioning: Dataset and Analysis	Mar 6, 2019	Image CaptioningImage Description	CodeCode Available
Unsupervised Visual Sense Disambiguation for Verbs using Multimodal Embeddings	Mar 30, 2016	Image DescriptionImage Retrieval	CodeCode Available
CIDEr-R: Robust Consensus-based Image Description Evaluation	Sep 28, 2021	DescriptiveImage Description	CodeCode Available
Pragmatic factors in image description: the case of negations	Jun 20, 2016	Image DescriptionNegation	CodeCode Available
Large Language Models can Share Images, Too!	Oct 23, 2023	Image DescriptionSentence	CodeCode Available
Cross-linguistic differences and similarities in image descriptions	Jul 6, 2017	Image DescriptionSpecificity	CodeCode Available
Varying image description tasks: spoken versus written descriptions	Aug 1, 2018	Image Description	CodeCode Available
Localized Symbolic Knowledge Distillation for Visual Commonsense Models	Dec 8, 2023	Image DescriptionInstruction Following	CodeCode Available
Long-term Recurrent Convolutional Networks for Visual Recognition and Description	Nov 17, 2014	Image DescriptionRetrieval	CodeCode Available
Improving Visual-Semantic Embeddings by Learning Semantically-Enhanced Hard Negatives for Cross-modal Information Retrieval	Oct 10, 2022	Cross-Modal Information RetrievalImage Description	CodeCode Available
MAGID: An Automated Pipeline for Generating Synthetic Multi-modal Datasets	Mar 5, 2024	DiversityImage Description	CodeCode Available
Measuring the Diversity of Automatic Image Descriptions	Aug 1, 2018	DiversityImage Description	CodeCode Available
MiCEval: Unveiling Multimodal Chain of Thought's Quality via Image Description and Reasoning Steps	Oct 18, 2024	Image DescriptionInformativeness	CodeCode Available
What a neural language model tells us about spatial relations	Jun 1, 2019	Image DescriptionLanguage Modeling	CodeCode Available
Does Multimodality Help Human and Machine for Translation and Image Captioning?	May 30, 2016	Image CaptioningImage Description	CodeCode Available
Difficult Task Yes but Simple Task No: Unveiling the Laziness in Multimodal LLMs	Oct 15, 2024	Image DescriptionMultiple-choice	CodeCode Available
Describing Videos by Exploiting Temporal Structure	Feb 27, 2015	Action RecognitionImage Description	CodeCode Available
VisBias: Measuring Explicit and Implicit Social Biases in Vision Language Models	Mar 10, 2025	Image DescriptionMultiple-choice	CodeCode Available
Multi30K: Multilingual English-German Image Descriptions	May 2, 2016	Image DescriptionMachine Translation	CodeCode Available
Contextualize, Show and Tell: A Neural Visual Storyteller	Jun 3, 2018	DecoderImage Description	CodeCode Available
Multilingual Image Description with Neural Sequence Models	Oct 15, 2015	Image CaptioningImage Description	CodeCode Available
Room for improvement in automatic image description: an error analysis	Apr 13, 2017	Image Description	CodeCode Available

Show:10 25 50

← PrevPage 3 of 4Next →

No leaderboard results yet.