cross-modal alignment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–225 of 342 papers

Title	Date	Tasks	Status
Fully Aligned Network for Referring Image Segmentation	Sep 29, 2024	cross-modal alignmentDecoder	—Unverified
Fusing Cross-modal and Uni-modal Representations: A Kronecker Product Approach	Jun 10, 2025	cross-modal alignment	—Unverified
GALLa: Graph Aligned Large Language Models for Improved Source Code Understanding	Sep 6, 2024	cross-modal alignmentLanguage Modelling	—Unverified
GatedxLSTM: A Multimodal Affective Computing Approach for Emotion Recognition in Conversations	Mar 26, 2025	cross-modal alignmentEmotion Classification	—Unverified
Generalized Zero-Shot Classification via Semantics-Free Inter-Class Feature Generation	Jan 1, 2025	Classificationcross-modal alignment	—Unverified
Generating Vision-Language Navigation Instructions Incorporated Fine-Grained Alignment Annotations	Jun 10, 2025	cross-modal alignmentNavigate	—Unverified
GEXIA: Granularity Expansion and Iterative Approximation for Scalable Multi-grained Video-language Learning	Dec 10, 2024	cross-modal alignmentVideo Understanding	—Unverified
Hierarchical Cross-Modal Alignment for Open-Vocabulary 3D Object Detection	Mar 10, 2025	3D Object Detectioncross-modal alignment	—Unverified
Hire: Hybrid-modal Interaction with Multiple Relational Enhancements for Image-Text Matching	Jun 5, 2024	cross-modal alignmentImage-text matching	—Unverified
HiTeA: Hierarchical Temporal-Aware Video-Language Pre-training	Dec 30, 2022	cross-modal alignmentTGIF-Action	—Unverified
How do Cross-View and Cross-Modal Alignment Affect Representations in Contrastive Learning?	Nov 23, 2022	Contrastive Learningcross-modal alignment	—Unverified
Improving Cross-modal Alignment for Text-Guided Image Inpainting	Jan 26, 2023	cross-modal alignmentImage Inpainting	—Unverified
Improving Cross-modal Alignment with Synthetic Pairs for Text-only Image Captioning	Dec 14, 2023	cross-modal alignmentDecoder	—Unverified
Improving Medical Visual Representation Learning with Pathological-level Cross-Modal Alignment and Correlation Exploration	Jun 12, 2025	cross-modal alignmentImage to text	—Unverified
Improving speech translation by fusing speech and text	May 23, 2023	cross-modal alignmentMachine Translation	—Unverified
InfoMAE: Pair-Efficient Cross-Modal Alignment for Multimodal Time-Series Sensing Signals	Apr 13, 2025	cross-modal alignmentSelf-Supervised Learning	—Unverified
Integrate Temporal Graph Learning into LLM-based Temporal Knowledge Graph Model	Jan 21, 2025	cross-modal alignmentGraph Embedding	—Unverified
Intriguing Properties of Large Language and Vision Models	Oct 7, 2024	cross-modal alignmentLarge Language Model	—Unverified
JPG - Jointly Learn to Align: Automated Disease Prediction and Radiology Report Generation	Oct 1, 2022	cross-modal alignmentDisease Prediction	—Unverified
KD-VLP: Improving End-to-End Vision-and-Language Pretraining with Object Knowledge Distillation	Jan 16, 2022	cross-modal alignmentKnowledge Distillation	—Unverified
LangBridge: Interpreting Image as a Combination of Language Embeddings	Mar 25, 2025	cross-modal alignment	—Unverified
Linguistic Query-Guided Mask Generation for Referring Image Segmentation	Jan 16, 2023	Contrastive Learningcross-modal alignment	—Unverified
Learning Better Visual Representations for Weakly-Supervised Object Detection Using Natural Language Supervision	Sep 29, 2021	cross-modal alignmentobject-detection	—Unverified
Learning by Hallucinating: Vision-Language Pre-training with Weak Supervision	Oct 24, 2022	cross-modal alignmentCross-Modal Retrieval	—Unverified
Learning Joint Embedding with Modality Alignments for Cross-Modal Retrieval of Recipes and Food Images	Aug 9, 2021	cross-modal alignmentCross-Modal Retrieval	—Unverified

Show:10 25 50

← PrevPage 9 of 14Next →

No leaderboard results yet.